AGNES -
Lehre und Prüfung online
Studierende in Vorlesung
Anmelden

Distributed Data Processing - Detailseite

Grunddaten
Veranstaltungsart Vorlesung Veranstaltungsnummer 3313065
Semester WiSe 2019/20 SWS 4
Rhythmus Moodle-Link  
Veranstaltungsstatus Freigegeben für Vorlesungsverzeichnis  Freigegeben  Sprache deutsch
Belegungsfristen - Eine Belegung ist online erforderlich Zentrale Nachfrist    14.10.2019 - 17.10.2019   
Zentrale Frist    01.07.2019 - 09.10.2019    aktuell

Termine

Gruppe 1 iCalendar Export iCalendar Export
  Tag Zeit Rhythmus Dauer Raum Raum-
plan
Lehrperson Status Bemerkung fällt aus am Max. Teilnehmer
iCalendar Export Do. 09:00 bis 11:00 wöch
Einzeltermine anzeigen
Erwin Schrödinger-Zentrum /Modul 1 - 1307 Rudower Chaussee 26 (RUD26) - (Unterrichtsraum) Weidlich findet statt     30
iCalendar Export Do. 11:00 bis 13:00 wöch
Einzeltermine anzeigen
Erwin Schrödinger-Zentrum /Modul 1 - 1307 Rudower Chaussee 26 (RUD26) - (Unterrichtsraum) Weidlich findet statt     30
Gruppe 1:


Zugeordnete Person
Zugeordnete Person Zuständigkeit
Weidlich, Matthias, Professor
Studiengänge
Abschluss Studiengang LP Semester
Master of Education (ISS)  Informatik 1. Fach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Master of Education (GYM)  Informatik 1. Fach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Master of Education (ISG)  Informatik 1. Fach ( Vertiefung: mit LA-Option; POVersion: 2018 )   -  
Master of Education (ISS)  Informatik 2. Fach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Master of Education (BS)  Informatik 2. Fach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Master of Education (GYM)  Informatik 2. Fach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Master of Education (ISG)  Informatik 2. Fach ( Vertiefung: mit LA-Option; POVersion: 2018 )   -  
Master of Science  Informatik Hauptfach ( Vertiefung: kein LA; POVersion: 2015 )   -  
Master of Science  Wirtschaftsinformatik Hauptfach ( Vertiefung: kein LA; POVersion: 2016 )   -  
Zuordnung zu Einrichtungen
Einrichtung
Mathematisch-Naturwissenschaftliche Fakultät, Institut für Informatik
Inhalt
Kommentar

Data analytics refers to the ability to extract information from data. It has to cope with rapidly growing volumes of data as well as increasing complexity of analysis questions and methods. These trends are no longer matched by performance improvements of single processing units (CPU/GPU cores). As such, sequential processing of data on a single machine is no longer a viable option. Rather, systems for data analytics need to embrace parallel and distributed computation in order to achieve scalability by increasing the number of processing units.

This lecture introduces models and methods to build systems for distributed data processing. That includes foundational aspects, reaching from data models through encoding and replication schemes to notions of consistency and consensus. At the same time, the lecture covers practical implementations of distributed data processing based on infrastructures such as Akka, Spark, Flink, and Kafka.

Bemerkung

The course will be given in English.

Exercises are integrated in the lecture. Solutions to these exercises will be collected and graded. Successful completion of the exercises is a prerequisite for taking the final exam and earn the LP.

 

Strukturbaum

Die Veranstaltung wurde 1 mal im Vorlesungsverzeichnis WiSe 2019/20 gefunden:

Humboldt-Universität zu Berlin | Unter den Linden 6 | D-10099 Berlin