Einführung

DiaCollo ist ein Werkzeug für das Auffinden von typischen Wortverbindungen (Kollokationen) zu einem Stichwort in einem bestimmten Zeitraum und die visuell aufbereitete Darstellung der Ergebnisse. Als Kollokation wird eine gemeinsame Verwendung zweier Inhaltswörter bezeichnet, wobei a) das gemeinsame Vorkommen in Texten auffällig, d.h. deutlich häufiger als statistisch erwartbar, ist, und b) die beiden Wörter in einer grammatischen Beziehung zueinander stehen, zum Beispiel als Nomen und modifizierendes Adjektiv (brennbare Flüssigkeit) oder als Koordination von zwei Nomen (Umwelt und Reaktorsicherheit). Eine Kollokation besteht aus einer Basis (auch Stichwort genannt) und einem Kollokator.

Anhand der Wörter, mit denen zusammen ein Stichwort in einem bestimmten Zeitraum häufig auftaucht, lässt sich der Wandel in der Bedeutung dieses Stichworts nachzeichnen (s. Beispiel 3 des Tutorials). Wenn es sich bei dem Stichwort um ein Schlüsselwort in einem oder mehreren politischen oder gesellschaftlichen Diskursen handelt, dann können die Veränderungen in der Verwendung des Wortes auch als Zeichen z.B. für politische oder kulturelle Veränderungen gedeutet werden. Im Laufe der Zeit verblasst und verschwindet die Relevanz einiger Zusammenhänge, wohingegen andere Wortverbindungen an Relevanz gewinnen (s. Beispiel 1 des Tutorials). DiaCollo macht diese über viele Texte verstreuten Wortverbindungen sichtbar und ermöglicht darüber hinaus, zeitliche Veränderungen in der Verwendungshäufigkeit von Gruppen von Wörtern zu betrachten und vergleichen. Die Wortgruppen können über die Form der Wörter spezifiziert werden (z.B. die häufigsten Wörter, die mit “bürger-” beginnen oder auf “-krise” enden, s. Beispiel 7 des Tutorials) oder über Bedeutungsverwandtschaft (die häufigsten Wörter, die Flüssigkeiten in Hinblick auf den Akt des Trinkens bezeichnen, s. Beispiel 8 des Tutorials).

Um die Veränderung eines Wortes und seiner Verwendung oder einer Gruppe von Wörtern über einen längeren Zeitraum verfolgen zu können, bedarf es einer großen Menge von digitalisierten Texten (eines großen Textkorpus), deren jeweilige Entstehungs- oder Publikationszeit bekannt und in den jeweiligen Metadaten angegeben ist. Dadurch können die typischen Wortverbindungen einer bestimmten “Zeitscheibe” (z.B. einer bestimmten Dekade) zugeordnet werden. Das Zentrum Sprache bietet hier verschiedene Textsammlungen an, deren Entstehung sich über einen jeweils längeren Zeitraum erstreckt, unter anderem:

  • dta+dwds : Die Referenzkorpora des Deutschen Textarchivs und des DWDS (Zeitraum von 1650 bis 2000).
  • dta : Das Deutsche Textarchiv ausschließlich (1650–1900)
  • kern : Das DWDS-Kernkorpus ausschließlich (1900–2000)
  • zeit : Die Wochenzeitung “Die Zeit” (1946–2015)
  • zeitungenxl : Eine Zusammenstellung verschiedener deutscher/österreichischer/schweizer Tages- und Wochenzeitungen (1946–2024)

Eine aktuelle Liste der zugänglich Korpora befindet sich in Bryan Jurishs Hilfeseite zu DiaCollo , im Abschnitt Introduction.

Dieses Handbuch besteht aus drei Teilen.

Im ersten Teil werden einige Beispiele für die sprachhistorische Analyse mit DiaCollo vorgeführt. Im zweiten Teil werden einige Beispiele für Anwendungsszenarien vorgestellt, unter denen man mit DiaCollo Daten erheben und analysieren kann:

  • Szenario 1: ein Stichwort und seine Kollokationen in verschiedenen Zeiträumen
  • Szenario 2: Vergleich zweier (verwandter) Stichwörter durch Unterschiede ihrer Kollokationen in verschiedenen Zeiträumen
  • Szenario 3: Vergleich mehrerer formähnlicher oder verwandter Stichwörter hinsichtlich ihrer Verwendungshäufigkeit in bestimmten Zeiträumen

Dieser Teil dient hauptsächlich der Einführung in die Arbeit mit diesem Werkzeug und ist als Unterstützung im Unterricht bzw. für das Selbststudium gedacht. Das Durcharbeiten der Beispiele erfordert etwas Zeit, ermöglicht aber einen eher intuitiven Zugang zu diesem komplexen Werkzeug.

Im zweiten Teil - Tipps - werden, für den kundigen Benutzer, einige kurze Antworten auf typische und häufig wiederkehrende Fragen gegeben.

Im dritten Teil werden die Parameter und Parameterwerte aufgelistet, mit denen die Analyse gesteuert werden kann. Dieser Teil orientiert sich an der von Bryan Jurish erstellten Hilfe für DiaCollo . Er soll in erster Linie als Referenz dienen, sofern bereits grundlegende Kenntnisse in der Bedienung des Werkzeugs vorhanden sind.