Jonas Rumpf / Simon Pickl / Stephan Elspass / Werner Kšnig / Volker Schmidt: Structural Analysis of dialect maps using methods from spatial statistics

 

In diesem Beitrag wird ein neues Verfahren zur objektiven und automatischen Analyse von Sprachkarten vorgestellt. Anders als bisherige dialektometrische Verfahren zielt es vorerst nicht auf die Einteilung und Analyse von Dialekten anhand von gro§en Korpora von Merkmalskarten ab, sondern auf die quantitative Beurteilung von strukturellen Eigenschaften einzelner Merkmals­karten, die von der klassischen Dialektometrie weitgehend ignoriert werden. So soll unsere Methode es ermšglichen, Merkmalskarten zu vergleichen und in ihnen bestimmte Strukturen zu finden, anstatt sie zu kumulieren. Dazu werden mittels rŠumlich-statistischer Methoden fŸr alle Varianten des betreffenden Merkmals im gesamten Untersuchungsgebiet IntensitŠten, das hei§t die erwarteten AuftretenshŠufigkeiten, geschŠtzt. Durch eine Kombination der erhaltenen IntensitŠtsfelder ergeben sich FlŠchenkarten, die als Grundlage fŸr die weitere Analyse dienen. Dabei werden verschiedene Charakteristiken, wie zum Beispiel die GesamtlŠnge der Grenzen zwischen den Gebieten unterschiedlicher Varianten, herangezogen, um objektive Aussagen Ÿber die ãHomogenitŠtÒ, ãKomplexitŠtÒ und ãKompaktheitÒ von Gebieten bzw. Karten treffen zu kšnnen. Die Ergebnisse dieses Verfahrens werden exemplarisch anhand einiger Karten aus dem SBS vorgestellt und interpretiert.

      Theoretische Grundlage fŸr diese Vorgehensweise ist die Annahme, dass die Belege eines Sprachatlas Stichproben sind, die im Einzelfall nicht zwangslŠufig zu hundert Prozent valide sind. So ist es vorstellbar, dass eine GewŠhrsperson an einem Ort eine andere Antwort gegeben hat, als es der Gro§teil der anderen mšglichen GewŠhrspersonen getan hŠtte, hŠtte man die gesamte zu untersuchende Bevšlkerungsschicht befragt. Die ValiditŠt der Belege kann aber eingeschŠtzt werden, wenn man die umliegenden Orte betrachtet: Haben alle dieselbe Antwort gegeben, so ist die ValiditŠt als hoch einzuschŠtzen; haben alle eine abweichende Antwort gegeben, so ist der Beleg in Frage zu stellen. Dabei ist die Bedeutung der anderen Orte fŸr die Bewertung eines Beleges umso hšher, je nŠher sie ihm sind, da geographische NŠhe in Beziehung steht zu dem sprachlichen Kontakt, der zwischen ihnen stattfindet. (Die geographische NŠhe ist natŸrlich nur einer von vielen Faktoren, doch der einzige, der objektiv und einfach zu quantifizieren ist. Der Einfluss von Verkehrswegen, Territorien, landschaftlichen Gegebenheiten u.Š. muss deshalb vorerst unberŸcksichtigt bleiben.) So kann ausgehend von den gegebenen Belegen – mit statistischen Methoden – fŸr jeden Ort geschŠtzt werden, welche Variante die am wahrscheinlichsten zu erwartende ist, auch wenn der jeweilige Beleg tatsŠchlich ein anderer ist. So werden FlŠchenkarten generiert, die Ausrei§er automatisch ausgleichen, die Dominanz der jeweils wahrscheinlichsten Varianten durch die Farbgebung darstellen und dadurch die tatsŠchliche linguistische Situation angemessener wiedergeben als die unmittelbar auf den Stichproben basierenden Punktsymbolkarten.

      Grundlage fŸr die Analyse ist eine Datenbank, die das Auftreten der verschiedenen Varianten an den Belegorten des Untersuchungsgebiets enthŠlt. Sie wird zunŠchst nach den einzelnen Varianten separiert, so dass fŸr jede Variante eine so genannte Vorkommenskarte generiert werden kann, die nur verzeichnet, wo die Variante auftritt und wo nicht. AbhŠngig von der rŠumlichen Verteilung einer Variante wird nun fŸr jeden Ort die IntensitŠt der Verteilung geschŠtzt, die sich als Auftretenswahrscheinlichkeit der betreffenden Variante interpretieren lŠsst. Im nŠchsten Schritt werden die IntensitŠtsfelder der Varianten (siehe Abb.2) zu einer FlŠchenkarte vereint (siehe zum Beispiel Abb.3), indem jeder Ort der FlŠche zugerechnet wird, deren Variante die hšchste IntensitŠt an diesem Ort aufweist, das hei§t deren Auftreten dort am ehesten zu erwarten ist.

      Die so erzeugten FlŠchenkarten kšnnen auf verschiedene Weise hinsichtlich ihrer strukturellen Eigenschaften untersucht werden: Die LŠnge der Grenzlinien zwischen den FlŠchen kann als eine Ma§zahl fŸr die KomplexitŠt der Karte betrachtet werden, die IntensitŠten geben – gemittelt – Aufschluss Ÿber die kleinrŠumige HomogenitŠt einer Karte. Weitere Ma§zahlen sind vorstellbar, einige davon werden kurz vorgestellt. Insgesamt bietet das vorgestellte Verfahren die Mšglichkeit, Karten von sprachlichen Merkmalen quantitativ und nach einheitlichen Ma§stŠben nach ihren Struktureigenschaften zu beurteilen, um so Aufschluss darŸber zu gewinnen, nach welchen GesetzmЧigkeiten sich bestimmte Merkmale rŠumlich entwickeln.

      In erster Linie aber sollen die ermittelten Werte die Basis fŸr weitere Forschung, die Ÿber die Analyse von Einzelkarten hinausgeht, sein. So kšnnen etwa bestimmte Hypothesen bezŸglich Sprachgrenzen und -gebieten ŸberprŸft werden, indem getestet wird, ob vorgegebenen Strukturen wie FlŸssen oder Territorialgrenzen eine statistisch signifikante Anzahl an Sprachgrenzen entspricht, die in einem grš§eren Korpus von Merkmalskarten bestimmt wurden. Des Weiteren kšnnen einfach kumulative Vorkommenskarten von linguistisch definierten Merkmalsgruppen wie Romanismen oder Standardismen erzeugt werden, um so auf einfache Weise horizontale oder vertikale Einflussbereiche festzustellen. Beim typologischen Vergleich der Karten wird es mšglich herauszufinden, inwieweit vergleichbare sprachliche Erscheinungen auch vergleichbare Verbreitungsmuster zeigen; bzw. umgekehrt, was vergleichbare Verbreitungsmuster auch sprachlich gemeinsam haben.

 

> zurŸck zur homepage

> zurŸck zum Gesamtinhaltsverzeichnis