Kommentar |
Clusteranalysen liegt die Annahme zugrunde, dass Datenverteilungen Cluster enthalten, wenn die Datenpunkte auf der Grundlage ihrer relativen Ähnlichkeit in Gruppen aufgeteilt werden können (Moisl 2015, 155). Clusteranalysen sind zugespitzt formuliert quantitative Analysen ohne Theorie und werden vielfältig für zum Beispiel Textkategorisierungen (z.B. Genres), Stilometrie oder Topic Modelling eingesetzt. Welche theoretischen Annahmen werden jedoch stillschweigend vorausgesetzt? Wie definiert man Ähnlichkeit? Wie können wir selbst Clusteranalysen durchführen? Welche erkenntnistheoretischen Möglichkeiten und Grenzen besitzt die Clusteranalyse? Diese Fragen werden wir anhand eines Fallbeispiel methodisch „hands on“ selbst bearbeiten und epistemisch diskutieren.
Moisl, Hermann. Cluster Analysis for Corpus Linguistics. Berlin ; Boston, 2015. Quantitative Linguistics; 66. Web. |