Veranstaltungsort:
Unicom-Gebäude
Raum: 9.3120
Mary-Somerville-Straße 9
28359 Bremen
Uhrzeit:
Do,: 14 - 17:30 Uhr; Fr.: 9 -17 Uhr
Btlg. Organisation:

Dieser Workshop mit Stefan Müller vom Trinity College Dublin bietet eine praktische Einführung in die Extraktion von Daten aus Texten und die Anwendung verschiedener Methoden zur Analyse dieser Daten. Zu den behandelten Themen gehören:

  • Vom Rohtext bis zum Korpus - wie man Textdaten sammelt und für die Analyse vorbereitet.
  • Klassifizierungstechniken - die ersten Schritte bei der Übersetzung von Texten in brauchbare Daten; überwachtes und unbeaufsichtigtes Lernen; Wörterbuchansätze und Themenmodellierung.
  • Skalierung - Überwachte und unbeaufsichtigte Techniken.
  • Ein Überblick über weiterführende Themen.


Die angewandten Elemente des Workshops bedienen sich der Programmiersprache R. Daher ist eine grundlegende Vertrautheit mit R Voraussetzung für die Teilnahme am Kurs.

Registrierung: BIGSSS Fellows registrieren sich über CampusNet, SOCIUM- und SFB-1342-Mitglieder senden bitte eine kurze E-Mail an mlarsen@bigsss-bremen.de