In den letzten Jahren hat sich die generierte Menge an Daten massiv erhöht. In diesem Zusammenhang wird häufig der Modebegriff “Big Data” verwendet, um Daten aus Online Umgebungen wie Webseiten oder sozialen Netzwerken zu beschreiben. Während solche Daten für eine Vielzahl von Forschungsfeldern relevant sind, ist deren Beschaffung und Verarbeitung – Data Scraping - aufgrund komplexer Strukturen oder fehlenden Programmierkenntnissen häufig eine Einstiegshürde für interessierte Wissenschaftler. In diesem Kurs sollen Grundkenntnisse im Bereich Data Scraping anhand einer praxisorientierten Einführung in die Programmiersprache Python vermittelt werden, welche kostenlos zugänglich ist und als einsteigerfreundlich gilt. Aufbauend auf den vermittelten Grundkenntnissen der Programmierung werden Verfahren besprochen, mit denen automatisiert Inhalte von Webseiten (z.B. Blogs) und Daten über Programmierschnittstellen (z.B. Twitter) erfasst und verarbeitet werden können. Es werden keinerlei Programmierkenntnisse vorausgesetzt. Da die Erlernung einer Programmiersprache zwangsläufig technischer Natur ist, fällt der Einstieg jedoch erfahrungsgemäß Teilnehmer/innen leichter, die sich bereits Kenntnisse im Umgang mit syntaxbasierten Programmen/Sprachen (Stata, SPSS, R) angeeignet haben. Entsprechende Kenntnisse sind weiterhin hilfreich für die anschließende Analyse der Daten, wofür im Zuge der Veranstaltung nur sehr begrenzt Zeit zur Verfügung stehen wird.
Der Kurs wird in zwei Blocks im Umfang von jeweils 2x8 Stunden Präsenzzeit angeboten. (Termine: 28./29./31.08. und 01.09.2017, Zeit: 9.00 s.t. - 17.00 Uhr)
Ein Leistungsnachweis für 5 ECTS kann über die Bearbeitung einer unbenoteten Hausaufgabe und einer benoteten Abschlussaufgabe erbracht werden. Die Aufgaben prüfen sowohl das Verständnis als auch die eigenständige, praktische Anwendung der im Kurs erlernten Kenntnisse auf neue Problemstellungen.
Anmeldung über: https://hu.berlin/datascraping
Der Anmeldezeitraum für die Veranstaltung endet am 28.07.2017
|