AGNES -
Lehre und Prüfung online
Studierende in Vorlesung
Anmelden

Automated Web Data Collection and Text as Data - Detailseite

  • Funktionen:
  • Online Belegung noch nicht möglich oder bereits abgeschlossen
Grunddaten
Veranstaltungsart Seminar Veranstaltungsnummer 53095
Semester SoSe 2023 SWS 2
Rhythmus keine Übernahme Moodle-Link  
Veranstaltungsstatus Freigegeben für Vorlesungsverzeichnis  Freigegeben  Sprache englisch
Belegungsfristen - Eine Belegung ist online erforderlich
Veranstaltungsformat Präsenz

Termine

Gruppe 1
Tag Zeit Rhythmus Dauer Raum Gebäude Raum-
plan
Lehrperson Status Bemerkung fällt aus am Max. Teilnehmer/-innen
Di. 16:00 bis 18:00 wöch 205 (Seminarraum)
Stockwerk: 2. OG


alttext alttext
Uni3b Institutsgebäude - Universitätsstraße 3b (UNI 3)

Außenbereich nutzbar Innenbereich eingeschränkt nutzbar Parkplatz vorhanden Barrierearmes WC vorhanden Barrierearme Anreise mit ÖPNV möglich
  findet statt     25
Gruppe 1:
Zur Zeit keine Belegung möglich


Zugeordnete Person
Zugeordnete Person Zuständigkeit
Erfort, Cornelius
Studiengänge
Abschluss Studiengang LP Semester
Bachelor of Arts  Sozialwissenschaften Monobachelor ( Vertiefung: kein LA; POVersion: 2014 )     -  
Bachelor of Arts  Sozialwissenschaften Zweitfach ( Vertiefung: kein LA; POVersion: 2014 )     -  
Bachelor of Science  Sozialwissenschaften Zweitfach ( Vertiefung: kein LA; POVersion: 2014 )     -  
Programmstudium-o.Abschl.  Sozialwissenschaften Programm ( POVersion: 1999 )     -  
Zuordnung zu Einrichtungen
Einrichtung
Kultur-, Sozial- und Bildungswissenschaftliche Fakultät, Institut für Sozialwissenschaften
Inhalt
Kommentar

The internet has not only become an integral part of everyday life but also an important data source for social science research. Instead of conducting costly surveys or experiments, many research questions can be answered using openly available data and innovative methods. Access to social media data, for example, allows us to measure the attitudes and issue agendas of political actors by analyzing their communication.

Students will acquire valuable research skills including automated web data collection and quantitative text analysis using the statistical software R. These skills will enable students to generate datasets for their own empirical research projects.

Additionally, we will discuss cutting-edge social science applications of these methods to showcase the advantages these methods have to offer for empirical research.

 

Requirements:

Knowledge of the basics of R and RStudio is an advantage but not a requirement. (See e.g. “The Basics” of R at posit: https://posit.cloud/learn/primers/1).

Literatur

Automated Data Collection with R – A Practical Guide to Web Scraping and Text Mining Simon Munzert, Christian Rubba, Peter Meißner, Dominic Nyhuis John Wiley & Sons, Chichester, 2014. https://doi.org/10.1002/9781118834732 (online verfügbar im Netz der HU)

Grolemund, G., & Wickham, H. (2017). R for Data Science. O’Reilly Media. https://r4ds.had.co.nz/ 

Prüfung

Apart from weekly participation and preparation (readings) for the seminar, students will be expected to give a presentation about one of the assigned readings in one of the sessions and to complete short weekly exercises.

Strukturbaum

Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester SoSe 2023. Aktuelles Semester: WiSe 2024/25.
Humboldt-Universität zu Berlin | Unter den Linden 6 | D-10099 Berlin