Jonas Rumpf / Simon Pickl / Stephan Elspass / Werner Kšnig / Volker
Schmidt: Structural Analysis
of dialect maps using methods from spatial statistics
In diesem Beitrag wird ein neues Verfahren zur
objektiven und automatischen Analyse von Sprachkarten vorgestellt. Anders als
bisherige dialektometrische Verfahren zielt es vorerst nicht auf die Einteilung
und Analyse von Dialekten anhand von gro§en Korpora von Merkmalskarten ab,
sondern auf die quantitative Beurteilung von strukturellen Eigenschaften
einzelner Merkmalskarten, die von der klassischen Dialektometrie weitgehend
ignoriert werden. So soll unsere Methode es ermšglichen, Merkmalskarten zu
vergleichen und in ihnen bestimmte Strukturen zu finden, anstatt sie zu kumulieren.
Dazu werden mittels rŠumlich-statistischer Methoden fŸr alle Varianten des
betreffenden Merkmals im gesamten Untersuchungsgebiet IntensitŠten, das hei§t
die erwarteten AuftretenshŠufigkeiten, geschŠtzt. Durch eine Kombination der
erhaltenen IntensitŠtsfelder ergeben sich FlŠchenkarten, die als Grundlage fŸr
die weitere Analyse dienen. Dabei werden verschiedene Charakteristiken, wie zum
Beispiel die GesamtlŠnge der Grenzen zwischen den Gebieten unterschiedlicher
Varianten, herangezogen, um objektive Aussagen Ÿber die ãHomogenitŠtÒ, ãKomplexitŠtÒ
und ãKompaktheitÒ von Gebieten bzw. Karten treffen zu kšnnen. Die Ergebnisse
dieses Verfahrens werden exemplarisch anhand einiger Karten aus dem SBS vorgestellt
und interpretiert.
Theoretische
Grundlage fŸr diese Vorgehensweise ist die Annahme, dass die Belege eines
Sprachatlas Stichproben sind, die im Einzelfall nicht zwangslŠufig zu hundert
Prozent valide sind. So ist es vorstellbar, dass eine GewŠhrsperson an einem Ort
eine andere Antwort gegeben hat, als es der Gro§teil der anderen mšglichen GewŠhrspersonen
getan hŠtte, hŠtte man die gesamte zu untersuchende Bevšlkerungsschicht befragt.
Die ValiditŠt der Belege kann aber eingeschŠtzt werden, wenn man die
umliegenden Orte betrachtet: Haben alle dieselbe Antwort gegeben, so ist die
ValiditŠt als hoch einzuschŠtzen; haben alle eine abweichende Antwort gegeben,
so ist der Beleg in Frage zu stellen. Dabei ist die Bedeutung der anderen Orte
fŸr die Bewertung eines Beleges umso hšher, je nŠher sie ihm sind, da
geographische NŠhe in Beziehung steht zu dem sprachlichen Kontakt, der zwischen
ihnen stattfindet. (Die geographische NŠhe ist natŸrlich nur einer von vielen
Faktoren, doch der einzige, der objektiv und einfach zu quantifizieren ist. Der
Einfluss von Verkehrswegen, Territorien, landschaftlichen Gegebenheiten u. Š. muss deshalb
vorerst unberŸcksichtigt bleiben.) So kann ausgehend von den gegebenen Belegen –
mit statistischen Methoden – fŸr jeden Ort geschŠtzt werden, welche Variante
die am wahrscheinlichsten zu erwartende ist, auch wenn der jeweilige Beleg tatsŠchlich
ein anderer ist. So werden FlŠchenkarten generiert, die Ausrei§er automatisch
ausgleichen, die Dominanz der jeweils wahrscheinlichsten Varianten durch die
Farbgebung darstellen und dadurch die tatsŠchliche linguistische Situation
angemessener wiedergeben als die unmittelbar auf den Stichproben basierenden
Punktsymbolkarten.
Grundlage
fŸr die Analyse ist eine Datenbank, die das Auftreten der verschiedenen
Varianten an den Belegorten des Untersuchungsgebiets enthŠlt. Sie wird zunŠchst
nach den einzelnen Varianten separiert, so dass fŸr jede Variante eine so
genannte Vorkommenskarte generiert werden kann, die nur verzeichnet, wo die Variante
auftritt und wo nicht. AbhŠngig von der rŠumlichen Verteilung einer Variante
wird nun fŸr jeden Ort die IntensitŠt der Verteilung geschŠtzt, die sich als Auftretenswahrscheinlichkeit
der betreffenden Variante interpretieren lŠsst. Im nŠchsten Schritt werden die
IntensitŠtsfelder der Varianten (siehe Abb. 2) zu einer FlŠchenkarte vereint (siehe zum Beispiel
Abb. 3), indem jeder Ort der FlŠche zugerechnet wird, deren Variante die hšchste
IntensitŠt an diesem Ort aufweist, das hei§t deren Auftreten dort am ehesten zu
erwarten ist.
Die
so erzeugten FlŠchenkarten kšnnen auf verschiedene Weise hinsichtlich ihrer
strukturellen Eigenschaften untersucht werden: Die LŠnge der Grenzlinien zwischen
den FlŠchen kann als eine Ma§zahl fŸr die KomplexitŠt der Karte betrachtet
werden, die IntensitŠten geben – gemittelt – Aufschluss Ÿber die
kleinrŠumige HomogenitŠt einer Karte. Weitere Ma§zahlen sind vorstellbar,
einige davon werden kurz vorgestellt. Insgesamt bietet das vorgestellte Verfahren
die Mšglichkeit, Karten von sprachlichen Merkmalen quantitativ und nach
einheitlichen Ma§stŠben nach ihren Struktureigenschaften zu beurteilen, um so
Aufschluss darŸber zu gewinnen, nach welchen GesetzmЧigkeiten sich bestimmte
Merkmale rŠumlich entwickeln.
In
erster Linie aber sollen die ermittelten Werte die Basis fŸr weitere Forschung,
die Ÿber die Analyse von Einzelkarten hinausgeht, sein. So kšnnen etwa
bestimmte Hypothesen bezŸglich Sprachgrenzen und -gebieten ŸberprŸft werden,
indem getestet wird, ob vorgegebenen Strukturen wie FlŸssen oder Territorialgrenzen
eine statistisch signifikante Anzahl an Sprachgrenzen entspricht, die in einem
grš§eren Korpus von Merkmalskarten bestimmt wurden. Des Weiteren kšnnen einfach
kumulative Vorkommenskarten von linguistisch definierten Merkmalsgruppen wie
Romanismen oder Standardismen erzeugt werden, um so auf einfache Weise
horizontale oder vertikale Einflussbereiche festzustellen. Beim typologischen
Vergleich der Karten wird es mšglich herauszufinden, inwieweit vergleichbare
sprachliche Erscheinungen auch vergleichbare Verbreitungsmuster zeigen; bzw.
umgekehrt, was vergleichbare Verbreitungsmuster auch sprachlich gemeinsam haben.
> zurŸck zur homepage
> zurŸck zum Gesamtinhaltsverzeichnis