User:FachueberM53

 Klassifikation  

Herkunft und Definition
Eine Klassifikation (vom französischen Substantiv „classification“ oder vom lateinischen „classis“: Abteilung und „facere“: machen, bedeutet also wörtlich: das Bilden („Machen“) von Klassen), synonym Aufgliederung oder Einteilung, ist eine Operation, die Objekte anhand einer Definition oder bestimmter Eigenschaften oder Merkmale einer Klasse zuordnet. Damit haben alle Mitglieder einer durch die Klassifizierung entstandenen Gruppe (oder Klasse) mindestens ein Merkmal, das die Mitglieder der anderen Gruppen nicht besitzen. Unter den Begriff der Klassifikation fällt sowohl der Prozess der Klassifikation, das System als Ergebnis des Klassenbildungsprozesses als auch der Prozess der Klassifizierung. Unter Klassifikation wird ganz allgemein eine Gruppierung oder Einteilung des gesamten Wissens, der Wissenschaft und ihrer Disziplinen nach einheitlichen methodischen Prinzipien verstanden. Indem wir klassifizieren, bewältigen wir die Vielzahl ungeordneter Eindrücke, die wir ständig durch unsere Sinne aufnehmen. Um Ordnung in das allgemeine Chaos zu bringen, benutzen wir ein Modell.

Zur Methode der Klassifizierung
Bei der Methode der Klassifizierung geht es in erster Linie darum, einzelne Elemente einer Gruppe oder Klasse zuzuordnen. Im Gegensatz zur Methode der Segmentierung setzt die Klassifikation die Kenntnis des gemeinsamen Kriteriums voraus. So werden Objekte mit gemeinsamen Kennzeichen und Kriterien in Gruppen oder Klassen sortiert. Um eine einwandfreie Klassifizierung gewährleisten zu können ist es notwendig eine Regel oder Entscheidungsfunktion voraus zusetzten, anhand derer die Zuordnung zu den Gruppen oder Klassen geschieht. So entstehen Klassifizierungsmodelle die sich aus den bestimmten Klassifizierungsregeln zusammensetzen. Beispiele für Klassifizierungskriterien wären z.B. richtig/falsch, trinkbar/nichttrinkbar oder auffällig/unauffällig. Menschen klassifizieren bewusst und intentional. Menschliche Neuronen klassifizieren, bevor das Bewusstsein eingeschaltet wird, in dem sie entscheiden ob ein Reiz wichtig oder unwichtig ist, und verarbeitet oder ignoriert wird. Als Voraussetzung der Begriffsbildung wird die Fähigkeit des Klassifizierens gehandelt, das Klassifizieren ist ein Grundelement der täglich menschlichen Kommunikation (das zuordnen von Lauten, Wörtern, Symbolen etc.). Damit kann die Fähigkeit zu Klassifizieren Rückschlüsse auf die Intelligenz gewähren. Grundlegend wird bei der Methode der Klassifizierung auf die Vorgehensweise des Buttom-up und Top-down zurückgegriffen, welche folgend genauer beschrieben werden.

Top-down
Bei dieser Vorgehensweise findet die Klassifizierung vom Allgemeinen oder Abstrakten in das Spezifische oder Konkrete statt. Genauer bedeutet dies, dass zunächst bestimme Klassengruppen vorgegeben werden, in welche die, anhand von festgelegten Merkmalen sortierten, „Objekte“ eingegliedert werden. Schließlich werden sodann die Klassengrenzen gezogen. Allgemeine Objekte werden in spezifische Klassen an Hand von ausgearbeiteten Merkmalen einsortiert. Ganz praktisch meint dies z.B. dass das Objekt Baum anhand unterschiedlicher Merkmale in die Klassen Laub- oder Nadelbaum eingeordnet wird. Zu beachten ist hierbei die Wahl der Kriterien und Merkmale, welche sich auch noch in dem Verfahren verändern können.

Bottom-up
Im Gegensatz zu der Top-down Methode ist dieses Verfahren zumeist nicht intendiert. Bei der Vorgehensweise des Buttom-up erfolgt die Klassifizierung von dem Spezifischen oder Konkreten ins Allgemeine oder Abstrakten. Beispiele hierfür wären der Erwerb und Ausbau von Sprache. So werden neue spezifische Wörter erst später übergeordneten Kategorien zu geordnet. So erlernt z.B. ein Kind den Begriff Tisch und erkennt später, dass das Wort Tisch zu den Nomen gehört.

Spezifische Klassifizierungsmethoden:
 * Bayes-Netzwerke
 * C4.5-Algorithmus
 * CART-Algorithmus
 * CHAID-Algorithmus
 * Diskriminanzanalyse
 * GID3-Algorithmus
 * ID3-Algorithmus
 * Logistische Regression
 * Naive-Bayes-Klassifikation
 * Prune-Verfahren
 * Regelgenerierung
 * Ripper-Algorithmus
 * SLIQ-Algorithmus
 * Support Vector Machines (SVM)
 * Window-Technik

Anwendungsgebiete
Klassifikationen erlauben die Unterteilung einer Datenmenge in Untermengen, die dann schneller durchsucht werden können. Sie sind überall dort einzusetzen, wo zur inhaltlichen Beschreibung von Dokumenten eine grobe Einteilung ausreicht und eine Ordnung von Objekten oder Sachverhalten gefordert ist. In erster Linie finden Klassifikationsmethoden Anwendung, um Gruppierungen, die mit Hilfe der explorativen Methoden gefunden wurden, zu bestätigen und für die Einordnung unbekannter Variablen zu nutzen. Klassifikationssysteme dienen der Zusammenfassung von isolierten Inhalten zu Klassen,

Klassifikationen werden demnach zur Dokumentation, im Dokumentenmanagement (im Zusammenhang mit der Indexierung von Metadaten), in der Warenwirtschaft (im Zusammenhang mit der Gruppierung von Produkten) sowie auch in der Wissenschaft als Instrument zur Systematisierung verwendet. Aus wissenschaftlicher Perspektive dienen Klassifikationen primär der Theoriebildung. Sie können entweder einer systematischen Theorie vorausgehen oder auch zu ihrer Veränderung und Weiterentwicklung beitragen. Klassifikationen sind somit sowohl ein Hilfsmittel zur heuristischen Erklärung als auch Anregung zur Formulierung neu zu prüfenden Hypothesen.

Typische Anwendungsgebiete der Klassifikation finden sich in der Herkunftsbestimmung von Lebensmitteln, bei der medizinischen Diagnose anhand von Krankheitssymptomen, der Überprüfbarkeit der Korrektheit von Steuererklärungen oder beim Filtern von Spam-Emails.

Die lineare Diskriminanzanalyse
Die Diskriminanzanalyse ist ein multivariates Verfahren zur Analyse von Gruppenunterschieden. Sie ermöglicht es, die Unterschiedlichkeit von zwei oder mehr Gruppen hinsichtlich mehrerer Variablen zu untersuchen. Folgende Fragen werden mit dieser Methode beantwortet:


 * Unterscheiden sich die Gruppen signifikant voneinander hinsichtlich der Variablen?


 * Welche Variablen sind zur Unterscheidung zwischen den Gruppen geeignet bzw. ungeeignet?

Außerdem lässt sich mit der Diskriminanzanalyse die Gruppenzugehörigkeit von Elementen prognostizieren (Klassifizierung):


 * In welche Gruppe ist ein neues Element, dessen Gruppenzugehörigkeit nicht bekannt ist, aufgrund seiner Merkmalsausprägungen einzuordnen?

Dabei wird versucht, aus einer Trainingsmenge, deren Klassenzugehörigkeit bekannt ist, eine Diskriminanzfunktion zu schätzen, welche die Objekte der Stichprobe richtig klassiﬁziert.

Die logistische Regression
Die logistische Regression ist ebenfalls ein statistisches Verfahren zur Klassiﬁkation kategorialer abhängiger Merkmale. Sie geht ähnlich wie die Diskriminanzanalyse vor, ist jedoch robuster und deshalb vielfältiger einsetzbar. Die logistische Regression zielt auf die Ableitung einer Eintrittswahrscheinlichkeit für das empirisch beobachtete Ereignis ab. Mit dieser Methode kann bestimmt werden, mit welcher Wahrscheinlichkeit z.B. der Kauf einer Margarine in Abhängigkeit von verschiedenen Einflussgrößen zu erwarten ist.

Probleme der Klassifikation
Die Verwendung von Klassifikationssystemen hat auch Nachteile. Eine Klassifikation ist eine Zusammenfassung und führt somit zu einem Informationsverlust. Im psychologischen Bereich besteht außerdem die Gefahr eines Stigmas (bei psychischen Krankheiten) oder auch der Stereotypisierung. Des Weiteren müssen für jeden Sachverhalt eine – und möglichst nur eine – genau passende Klasse vorhanden sein. Für eine detaillierte inhaltliche Erschließung werden viele Klassen benötigt. Weitere Probleme ergeben sich aus der relativen Unbeweglichkeit der Systematik sowie den vorwiegend hierarchischen Strukturen. Des Öfteren werden Sachverhalte in Klassen eingeordnet, in die sie nicht vollständig passen, was erneut zu Informationsverlust führen kann. Ist dies nicht möglich, entstehen mitunter Restobjekte, die in keine Klasse passen und so eine Residualkategorie erforderlich machen. Das Ordnungsprinzip Klassifikation ist für kleine Dokumentationen gut geeignet. Bei vielen Einheiten und guter Indexierungsgenauigkeit werden jedoch so viele Klassen benötigt, dass das Klassifikationssystem unbrauchbar bis unübersichtlich wird.

Literatur

 * Atteslander, P., Cromm, J. (2003) : Methoden der empirischen Sozialforschung.
 * Backhaus, K., Erichson, B., Plinke, W. (2011): Multivariate Analysemethoden: eine anwendungsorientierte Einführung. Berlin: Springer.
 * Butcher, J. N., Hooley, J. M., Mineka, S. (2009): Klinische Psychologie. München: Pearson.
 * Gaus, W. (2005): Dokumentations- und Ordnungslehre: Theorie und Praxis des Information Retrieval. Berlin: Springer.
 * Laatz, W. (1993): Empirische Methoden - Ein Lehrbuch für Sozialwissenschaftler.

Weblinks

 * Diskriminanzanalyse von Daniel Braunschweiger, Achim Schmidt und Tobias Spaltenberger
 * Klassifikation in der Bibliothek der Hyperkommunikation
 * Methoden zur Klassifikation von Mike Hüftle von der Universität Hannover