Juli 13th, 2009 by Administrator

Für viele sind Tagclouds (Schlagwortwolken) oder ihre allgemeinere Form der Wordcloud nicht viel mehr als eine ästhetisch ansprechende Spielerei. Das hängt sicher auch davon ab, dass solche Häufigkeitsauszählungen von signifikanten Begriffen (denn darum handelt es sich eigentlich) mittlerweile nicht mehr reine Wortlisten sind, sondern wie kleine Kunstwerke aussehen: mit unterschiedlichen Schrifttypen, Formaten, Schreibrichtungen, wenn nicht sogar als dreidimensionale interaktive Objekte.

Meine erste Begegnung mit Tagclouds kam – wahrscheinlich bin ich da kein Einzelfall – mit der Social-Bookmarking-Plattform del.icio.us bzw. der Fotoplattform Flickr. Die Tagclouds waren damals der hübsche Zwilling der Folksonomy. Dieser Kunstbegriff von Thomas Vander Wal verbindet die Weisheit der “einfachen” Leute (”folk”) mit dem Ordnungsstreben der Taxonomen. Folksonomien sind ein Paradebeispiel für eine der soziologischen Grundweisheiten – nämlich der Entstehung von Kollektivtatsachen durch das unkoordinierte Handeln Einzelner. Die Folksonomy, die durch das Verschlagworten eines Bildes durch viele unterschiedliche Nutzer entsteht, ist mehr als die Summe ihrer Teile, denn sie stellt die Wissensordnung einer Gruppe oder Masse dar.

Auf einzelne Texte angewendet, können Wordclouds auch als analytisches Instrument verwendet werden, das einem ermöglicht, einen Überblick über einen Text oder einen Textcorpus aus mittlerer Flughöhe zu gewinnen. Insofern überrascht es nicht, dass die qualitative Internetforschung dieses Instrument ebenfalls für sich entdeckt hat. Robert Kozinets, der Nestor der Netnography, stellt zwei Arten der Textanalyse gegenüber: Auf der einen Seite die immer ausgeklügelteren wortbasierten Analysen, in denen Texte in ihre einzelnen semantischen oder syntaktischen Atome zerlegt und vermessen werden. Auf der anderen Seite die sehr viel intuitivere und holistische Erfassung einer großen Textmenge durch Wordclouds (”diddling with the doodling”) wie zum Beispiel für die Reden von Barack Obama und Hillary Clinton letzten Dezember.

Natürlich sind diese Begriffswolken immer auch bis zu einem gewissen Grad Spielerei. Aber Kozinets ist überzeugt, dass richtig eingesetzt sehr viel mehr dahinter steckt:

In the play, in that visual appeal, I think there is something deeper that can happen. Because we get some good analysis packed into an at-a-glance form, I think we have opportunities to use that ultimate piece of ’software,’ the human mind and imagination, to glean insight from these word pictures. We can run poetic comparisons on these scrambled word omelets. And then we can use them to launch creative inquiries into the text. Delving deeper using all our other tools, from content analysis word counts to hermeneutic mindful deep breathing.

Für uns im ethority-Lab spielen beide Ansätze eine große Rolle, doch die spannendsten Einblicke ergeben sich oft aus der Kombination von analytischem und holistischem Vorgehen. Zum Beispiel wenn ein Textcorpus (etwa die Außendarstellung eines Unternehmens oder einer Partei in ihren Pressemitteilungen) ein ganz anderes Bild ergibt, je nachdem ob man den Gesamteindruck in Gestalt einer Wordcloud auf sich wirken lässt oder ob man die Texte in ihre Bestandteile zerlegt und im Detail analysiert. Auch die Gegenüberstellung von Titel und Abstract auf der einen und Wordcloud auf der anderen Seite kann zu interessanten Ergebnissen führen.

Eine sehr schöne Anwendung habe ich bei Christoph Koch gefunden, der die Wahlprogramme der Parteien nicht nur als Wordclouds dargestellt hat, sondern auch noch jeweils einen Claim daraus extrahiert hat. Dies sind also die “heimlichen Überschriften” der Bundestagswahlprogramme:

  • CDU/CSU: “Menschen müssen Deutschland mehr fördern!”
  • SPD: “Menschen müssen dafür mehr Arbeit!”
  • FDP: “Freiheit mehr Deutschland!”
  • Bündnis90/Grüne: “Brauchen deshalb neue Menschen!”
  • LINKE: “Frauen müssen Unternehmen sichern! Gesellschaft einführen!”
  • Piratenpartei: “Bürger müssen Daten! Zugang fordern Schutz!”

Tagclouds als Forschungsinstrument
Man kann die Texte noch weiter verdichten und jeweils das Kernkonzept der Parteiprogramme herausarbeiten:

  • “Deutschland” für die CDU
  • “Mehr” für die SPD – interessanterweise spielt im SPD-Programm der Begriff “SPD” nur eine untergeordnete Rolle. Neue Bescheidenheit? Auch die Begriffe auf dem Titel des Wahlprogramms “Sozial und demokratisch” tauche nur selten auf.
  • “FDP” für die FDP
  • “Menschen” für die Grünen
  • “LINKE” für Die Linke – in diesem Punkt eine interessante Parallele zur FDP, die ebenfalls den eigenen Namen in den Mittelpunkt stellt
  • “Bürger” für die Piratenpartei