AGNES -
Lehre und Prüfung online
Studierende in Vorlesung
Anmelden

Statistik und Data Science für die Informatik - Detailseite

  • Funktionen:
Grunddaten
Veranstaltungsart Vorlesung Veranstaltungsnummer 3313007
Semester SoSe 2022 SWS 3
Rhythmus Moodle-Link  
Veranstaltungsstatus Freigegeben für Vorlesungsverzeichnis  Freigegeben  Sprache deutsch
Belegungsfrist Es findet keine Online-Belegung über AGNES statt!
Veranstaltungsformat Keine Angabe

Termine

Gruppe 1
Tag Zeit Rhythmus Dauer Raum Gebäude Raum-
plan
Lehrperson Status Bemerkung fällt aus am Max. Teilnehmer/-innen
Di. 11:00 bis 13:00 wöch 0115 (Hörsaal)
Stockwerk: EG


alttext alttext
RudCh26-Modul 1 Erwin-Schrödinger-Zentrum - Rudower Chaussee 26 (RUD26)

Außenbereich nutzbar Innenbereich nutzbar Parkplatz vorhanden Leitsystem im Außenbereich Barrierearmes WC vorhanden Barrierearme Anreise mit ÖPNV möglich
Akbik findet statt

19.04.2022 -21.04.2022   -> Übungstermine


03.05.2022 - 05.05.2022   -> Übungstermine

  1000
Do. 11:00 bis 13:00 14tgl./1 0115 (Hörsaal)
Stockwerk: EG


alttext alttext
RudCh26-Modul 1 Erwin-Schrödinger-Zentrum - Rudower Chaussee 26 (RUD26)

Außenbereich nutzbar Innenbereich nutzbar Parkplatz vorhanden Leitsystem im Außenbereich Barrierearmes WC vorhanden Barrierearme Anreise mit ÖPNV möglich
Akbik findet statt

19.04.2022 -21.04.2022   -> Übungstermine


03.05.2022 - 05.05.2022   -> Übungstermine

  1000
Gruppe 1:
 


Zugeordnete Person
Zugeordnete Person Zuständigkeit
Akbik, Alan, Professor
Studiengänge
Abschluss Studiengang LP Semester
Bachelor of Arts  Informatik Zweitfach ( Vertiefung: kein LA; POVersion: 2015 )   -  
Bachelor of Arts  Informatik Zweitfach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Bachelor of Arts  Informationsman. & -tech. Monobachelor ( Vertiefung: kein LA; POVersion: 2015 )   -  
Bachelor of Arts  Informationsman. & -tech. Monobachelor ( Vertiefung: kein LA; POVersion: 2017 )   -  
Bachelor of Science  Informatik Kernfach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Bachelor of Science  Informatik Kernfach ( Vertiefung: kein LA; POVersion: 2015 )   -  
Bachelor of Science  Informatik Monobachelor ( Vertiefung: kein LA; POVersion: 2015 )   -  
Bachelor of Science  Informatik Zweitfach ( Vertiefung: kein LA; POVersion: 2015 )   -  
Bachelor of Science  Informatik Zweitfach ( Vertiefung: mit LA-Option; POVersion: 2015 )   -  
Zuordnung zu Einrichtungen
Einrichtung
Mathematisch-Naturwissenschaftliche Fakultät, Institut für Informatik
Inhalt
Kommentar

Hinweis: zum 01.04.2022 tritt eine Änderung der SPO 2015 in Kraft. Dort ist die Pflicht-Lehrveranstaltung M4 gestrichen. Stattdessen wird Statistik und Data Science für die Informatik gehört.

 

Studierende erlernen die mathematischen Grundlagen zur Lösung von Problemen der Numerik und der Data Science sowie zur probabilistischen Modellbildung.

 

  • Grundlagen der Statistik und Bezüge zu Data Science: 

Übersicht verschiedener Arten der Statistik (z.B. deskriptive Statistik, Inferenzstatistik, explorative Statistik) und Datentypen; motivierende Beispiele für Einsatz in Anwendungen; Daten und Ethik

 

  • Deskriptive Statistik und Wahrscheinlichkeitsverteilungen:

(Diskrete u. vor allem) kontinuierliche Verteilungen; grundlegende Konzepte für kontinuierliche Verteilungen (bedingte Wahrscheinlichkeit, stochastische Unabhängigkeit, Multiplikationssatz, Satz von Bayes, Erwartungswert, Varianz, Kovarianz usw.); Sampling, statistische Signifikanz und Tests; Bezug zu Data Science durch Umsetzen eines Beispielalgorithmus wie Naive Bayes Klassifikator

 

  • Inferenzstatistik:

Stochastische Optimierung durch Gradientenabstieg und ihr Einsatz in Inferenzstatistik (z.B. SGD, künstliche Evolution); angewandte Differentialrechnung; Entscheidungsräume und Verlustfunktionen (z.B. mittlerer absoluter Fehler, mittlere quadratische Abweichung, Hinge Loss, Negative Log Likelihood); Lineare Transformationen (Einbettungen von Datenpunkten in Vektorräumen); Regularisierungstechniken (z. B. Dropout, Mini-Batching, L1/L2-Regularisierung); statistische Gütekriterien (wie F-Maß, Korrektklassifikationsrate); Validierungsverfahren (z.B. Kreuzvalidierung); Ausblick auf vertiefende Themen (z.B. Multi-Class/Multi-Label, Regression, dynamische Daten); Bezug zu Data Science durch Umsetzen eines Beispielalgorithmus wie z.B. eines flachen Neuronalen Netzes zur Klassifikation

 

  • Informationstheorie:

Übersicht über für Statistik und Data Science relevante Grundbegriffe und Kenntnisse (z.B. Entropie, Kullback-Leibler-Divergenz, Kreuzentropie, Mutual Information, Differentielle Entropie); Bezug zu Data Science durch Verwendung in einem Beispielalgorithmus wie z.B. der Induktion von Entscheidungsbäumen

 

  • Explorative Statistik:

Ähnlichkeitsmaße (z.B. Kosinus-Ähnlichkeit, Euklidischer Abstand); Datentransformation (z. B. Diskretisierung, Normalisierung); Datenvisualisierung (z.B. Balkendiagramme, Box-Plots, Scatter-Plots, PCA); Intrinsische und extrinsische Gütekriterien; Bezug zu Data Science durch Umsetzen eines Beispielalgorithmus wie z. B. Clustering mit k-means

 

Bemerkung

Jede Woche findet eine zweistündige Vorlesung statt, jede zweite Woche findet zusätzlich eine weitere zweistündige Vorlesung statt (= 3 SWS).

An den Wochen, in denen keine zweite Vorlesung stattfindet, findet stattdessen eine zweistündige Übung statt.

19.04.2022 -21.04.2022   -> Übungstermine

03.05.2022 - 05.05.2022  -> Übungstermine

Strukturbaum

Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester SoSe 2022. Aktuelles Semester: WiSe 2024/25.
Humboldt-Universität zu Berlin | Unter den Linden 6 | D-10099 Berlin