GIS in der Archäologie – Seriation und Korrepondenzanalyse

22. November 2013 | 22. November 2014

Seriation

Seriation bzw. Korrepondezanalyse ist ein Verfahren zur statistischen und geographischen Analyse von mittelalterlichen (oder anderen) Gräberfeldern in der Archäologie. Es gibt einige Programme dafür; ich habe mich vor einigen Jahren jedoch hingesetzt und habe einen Prototypen für ein eigenes Programm für diese Aufgabe entwickelt. In diesem schon ewig geplanten Artikel möchte ich kurz das Verfahren vorstellen und möglichst anschaulich erklären, sowie den Prototypen meiner Software Gravedigger und das Konzept dazu vorstellen. Letztendlich handelt es sich im Grunde genommen dabei auch um ein spezielles GIS .

Die Idee für das Projekt entstand 2010 im Rahmen eines Seminars und einer Hausarbeit, in der ich die Aufgabe bekam, eine solche Analyse von Hand durchzuführen. Stattdessen ein Computerprogramm zu entwickeln, das diese Aufgabe für mich erledigen kann, ist natürlich unvergleichlich schwieriger – doch nachdem mein Professor mehrfach seine Zweifel an der Eignung von Computern in diesem Zusammenhang anbrachte, fühlte ich mich herausgefordert.

Tatsächlich stellte sich die Umsetzung als (für mich) alles andere als Trivial heraus, und ich habe fast einen Monat lang Blut und Wasser geschwitzt, bis das Programm endlich so funktionierte, wie ich es mir wünschte.

Die Methode: Seriation

Zunächst braucht man ein Gräberfeld, das man untersuchen möchte. Im Prinzip kann man diese Analyse-Technik auf jedes beliebige Gräberfeld (bzw. Friedhof), anwenden, in dem die Gräber hinreichend mit Beigaben ausgestattet sind. Des Weiteren muss ein hinreichend großer Datensatz – eine mindestens dreistellige Zahl von Gräbern – zur Verfügung stehen.

In der Völkerwanderungszeit etwa stattete man seine Toten reichhaltig mit Waffen, Schmuck und anderen Gegenständen aus und begrub sie in ausgedehnten Gräberfeldern, die daher Gegenstand unserer Betrachtungen waren.

Ich gehe davon aus, dass man die Analyse mit der Publikation des Gräberfeldes beginnt. In solchen archäologischen Katalogen sind i. d. R. die Funde nach Gräbern sortiert, beschrieben und abgebildet.

Das sieht dann etwa so aus:

Seriation Abb. 1

(Aus: René Joffroy: Le cimetière de Lavoye (Meuse) Nécropole mérovingienne. Paris 1974.)

Nun kommt gewissermaßen der archäologische Teil der Untersuchung. Man muss nun die einzelnen Fundgattungen (etwa Fibel, Schwert, Gürtelschnalle, Gefäß etc.) typisieren. Das bedeutet, man definiert sich z.B. mehrere Typen von Fibeln nach deren äußeren Merkmalen. Kenntnisse der Typologie generell sind dabei (theoretisch) nicht notwendig, da man den Funden des Gräberfeldes gewissermaßen unvoreingenommen entgegentreten soll. Soll heißen: Auch wenn man in der Forschung gewöhnlich Glockenbecher und Trichterbecher als zwei ganz verschiedene Typen anspricht, könnte man für dieses Analyseverfahren in einem Gräberfeld ruhig beide zu einem bestimmten Typ zusammenfassen, wenn alle anderen vorkommenden Gefäße etwas völlig anderes, Colabecher etwa, wären. Archäologische Erfahrung hilft andererseits in diesem Schritt ganz enorm, wichtige und unwichtige Merkmale der Funde zu unterscheiden. Hier etwa meine Typisierung von Fibeln im Gräberfeld von Basel-Kleinhüningen:

Seriation 2

Was nun herauskommt ist eine gewaltige Tabelle mit allen Grabbeigaben:

Seriation 3

Dies ist eine so genannte Kombinationstabelle. Hat man erst einmal diese Datenbank, kann man mit Gravedigger schon alle möglichen interessanten Karten erstellen.

Hier ein Beispiel, in dem ich die verschiedenen Typen von Schnallenbeigaben (im Gräberfeld von Lavoye) kartiert habe:

Seriation 4

Man kann aber mit einem solchen Datensatz noch weit mehr machen, als nur kartieren; man kann versuchen eine relative Chronologie zu ermitteln. Wie funktioniert das?

Als Beispiel möchte ich nicht mittelalterliche Gräber nehmen, sondern drei Comicfiguren:

Seriation 5

Als Merkmale in die Kombinationstabelle habe ich folgende Attribute aufgenommen: Ipod, Walkman, Chuck-Taylors-Schuhe von Nike-Converse, Holzfällerhemden.

Nimmt man alles Daten in eine Kombinationstabelle auf, sieht sie so aus:

Seriation 6

Nun wird diese Tabelle zuerst Zeilenweise sortiert, etwa so:

Seriation

und danach Spaltenweise:

Seriation 4

Sortiert wird immer so, dass ähnliche Datensätze beieinander liegen und zum Schluss möglichst eine Diagonale entsteht.

 

Und schon kann man deutlich sehen, dass Holzfällerhemden beliebt waren, bevor Chucks es waren, weil Person 3 gewissermaßen einen Mittler zwischen beiden einnimmt. (Die zeitliche Reihenfolge könnte eigentlich auch genau andersherum sein – jedenfalls aber liegt Figur 3 zwischen den anderen beiden – oder hat keine Ahnung von Mode).

 

Wendet man das gleiche Prinzip auf eine große Menge von Gräbern und Merkmalen an, geht es natürlich nicht so glatt auf, doch das Prinzip bleibt das gleiche. Ziel ist es, eine diagonale Anordnung von Kreuzen zu erschaffen.

 

Klassischerweise macht man das, in dem man die Tabelle ausdruckt (wenn sie nicht ohnehin mit Hand geschrieben ist), erst waagerecht und danach senkrecht in Streifen schneidet und so lange puzzelt, bis halbwegs eine Treppe aus Kreuzen dabei herauskommt. Das Ergebnis bei einem kleinen Datensatz sieht dann in etwa so aus:

Seriation

Übersichtlich, nicht wahr? Hier zeigt sich deutlich, wie überlegen die händische Methode doch dem Computer ist… Mit viel Fantasie kann man jetzt jedenfalls einzelne Zonen in der Tabelle unterscheiden:

Seriation

Diese Zonen kann man jetzt wiederum auf die Karte des Gräberfeldes übertragen und hat drei Zonen, die vermutlich zu unterschiedlichen Zeitpunkten entstanden sind, wobei die „grüne Periode“ zwischen den beiden anderen gelegen haben muss

Diesen ganzen Schritt soll Gravedigger automatisch machen. Darin sehe ich diverse Vorteile:

  • Bei der händischen Methode erkennt man an der optisch sichtbare Diagonale die optimale Anordnung. Tatsächlich kann es aber bei vielen Spalten durchaus vorkommen, dass eine sichtbare Diagonale nicht möglich ist – trotzdem aber eine sinnvolle Anordnung der Gräber.
  • Das Ergebnis kann wiederum automatisch auf die Karte gemapped werden – und zwar mit fließenden Farben anstatt klar getrennten Zonen.

Seriation

n diesem Beispiel sind alle Gräber einer Tabelle (alle Männergräber in Lavoye mit ausreichend Beigaben) zu sehen. Das oberste Grab in der verarbeiteten Kombinations-Tabelle ist lila, das unterste grün – alle anderen je nach ihrer Position eine Mischfarbe. Es lassen sich ganz deutlich einzelnen Zonen auf dem Plan des Gräberfeldes erkennen: Die grünen Gräber in der Mitte sind wohl die ältesten, von dort aus hat sich das Gräberfeld im Laufe der Jahre nach Westen und nach Norden ausgebreitet.

Das Konzept: Nutzung des euklidischen Abstandes

Wie aber funktioniert mein Programm? Ich möchte nicht die einzelnen Klassen und Module vorstellen, aus denen ich es zusammengesetzt habe, darauf eingehen, auf welche Datenformate es verwendet, oder wie das Mapping funktioniert usw., sondern nur den Weg, den ich zum Erstellen von Kombinationstabellen verwendet habe.

Ähnlichkeit von Gräbern

Das Problem zerfällt dabei in zwei Teilprobleme. Das erste Problem ist: Wie definiert bzw. misst man die Ähnlichkeit von zwei Gräbern? Ein Grab, das ist für die Software in diesem Fall eine Tabellenzeile (hier als Beispiel die Gräber 21 und 204, aus Platzgründen auf drei Zeilen aufgeteilt):

id

s1

s2

s3

s4

s5

s6

sx1

s7

s31

sx

sk1

sk2

skx

f1

f2

f3

f4

f5

f6

fx

bp

bo

br

bn

bf

21

1

1

1

1

1

204

1

1

1

1

ws

wxx

wx1

wx2

wx3

wx4

wd1

wd2

wds

m

a1

a2

a3

a4

l1

l2

l3

kk

kkx

ks1

kb

ks2

ks3

ksg

ksx

kgx

1

kt1

kt2

kt3

ktx

kx

xf

xc

xk

xs

xp

xr

xx

sex

position_x

position_y

comment

1

1

w

995

430

1

w

1294

672

Es gibt mehrere Methoden, die man anwenden kann, um die Ähnlichkeit zwischen zwei Objekten wie eben solchen Tabellenspalten zu messen. Ich habe in mein Programm mehrere implementiert (unter anderem den Pearson-Koeffizient), auf die ich nicht weiter eingehen möchte, weil sich eine bestimmte Methode als am geeignetsten herausgestellt hat: Der euklidische Abstand.

Hierbei wird die Tabellenspalte als Vektor im n-Dimensionalen Raum betrachtet (wobei n die Anzahl der zu betrachtenden Spalten ist). Der Abstand kann mit nebenstehender Formel (der Satz des Pythagoras für n Dimensionen) berechnet werden. Für die beiden Beispiel-Zeilen wäre er 0,0952380952381.

Pythagoras

Dabei ist zu beachten, dass 0 die völlige Identität zweier Zeilen ausdrückt, 1 die maximale Verschiedenheit. Mit 0,095.. sind die beiden Gräber also schon ziemlich verschieden. Zu beachten ist, dass hier nur über die Anwesenheit von Funden argumentiert wird, was sicherer ist, als über das über das Fehlen zu argumentieren – erst recht, weil dem Gräberkatalog von Lavoye nicht zu entnehmen ist, welche Gräber beraubt sind und welche nicht.

Eine Berechnung dieser Art bringt einen kleinen Vorteil ein, den ich aber bei der vorliegenden Untersuchung noch nicht genutzt habe, da er mir erst nach der Datenerfassung klar wurde. Man kann nämlich, wenn man ein Fundstück nicht eindeutig klassifizieren kann, es beiden Typen zuordnen. Ich habe zum Beispiel den Typ s31 eingeführt für Schnallen, bei denen nicht klar zu sagen ist, ob sie zu Typ s1 oder s3 gehören. Sinnvollerweise hätte ich bei einem Grab mit s31, anstatt dieses Hybrid-Types jeweils bei s1 und bei s3 „0,5“ eingetragen. So kann man ein Fundstück mit beschränkter Wahrscheinlichkeit einem Typus zuordnen, wenn man sich nicht sicher ist – und der Computer kann dem (im Gegensatz zu einem menschlichen Bearbeiter) bei der Erstellung der Kombinationstabelle problemlos Rechnung tragen.

Clustering und Sortierung

Nun ist es also Möglich die Ähnlichkeit von zwei Gräbern numerisch zu messen. Was kann man damit anfangen? Man kann die Gräber zum Beispiel Clustern, das bedeutet: Ihrer Ähnlichkeit nach in einem Dendrogramm darstellen (siehe Abbildung). Man kann sehen, dass die Gräber 104 und 197 sich besonders ähneln, 178 wiederum ähnelt beiden, aber nicht so sehr, wie sie einander.

Dendrogramm

So ein Dendrogramm gibt einem schon eine gewisse Vorstellung davon, welche Gräber zusammenpassen. Ihm fehlt aber – entgegen dem ersten optischen Eindruck – eine Reihenfolge der einzelnen Gräber. Aus Abbildung 17 z.B. kann man die Reihung 178-104-179 genauso schlussfolgern wie 178-179-104. Das Dendrogramm ist also ein nette Spielerei, hilft aber nicht, die Reihenfolge für die Kombinationstabelle zu finden.

Hier einen geeigneten Sortier-Algorithmus zu erfinden war der schwierigste Teil. Normalerweise, wenn Dinge sortiert werden müssen, kann ihnen eine Bestimmte absolute Wertigkeit zugewiesen werden (sollen z.B Buchstaben sortiert werden, ist die Wertigkeit die Position im Alphabet A->1, B->2 usw.) nach der dann sortiert wird. Das ist in unserem Fall unmöglich – genau diese Wertigkeit muss man ja finden. Alles was bekannt ist, sind die Ähnlichkeit-Beziehungen der Zeilen unter untereinander. Ich bin sicher, ich bin nicht der erste, der das Verfahren, das ich letztendlich einsetze, erfunden hat – ich habe es allerdings selbst entwickelt, und noch in keinem Buch gefunden und weiß daher nicht, wie es heißt.

Grob gesagt, bildet es ebenfalls Cluster der jeweils ähnlichsten Gräber, ordnet diese jedoch nicht in eine zweidimensionale Struktur wie dem Dendrogramm an, sondern hängt die Cluster aneinander, so das nachher eine Reihenfolge entsteht.

In der Hoffnung, eine deutlicher hervortretende Diagonale zu erhalten, habe ich das selbe Verfahren noch einmal auf die Spalten angewandt, dadurch erklärt sich die Reihenfolge der Spalten. Bei sehr normierten Daten ergibt sich dann auch eine optische Diagonale – da diese aber gar nicht unbedingt das optimale Ergebnis ist, auch nur dort. Spaltenweise Sortierung ist daher eigentlich überflüssig.

Schwächen

Das Programm hat natürlich seine Schwächen. Anders als ein menschlicher Bearbeiter, kann es nicht zwischen wichtigen (ein markanter Fibeltyp etwa) und unwichtigen (Messer, die praktisch überall auftreten) Spalten bzw. Fundypen unterscheiden. Einer zukünftigen Version des Programms könnte man eventuell eine Funktion einbauen, mit der man die Spalten unterschiedlich gewichten kann. Um so wichtiger ist auf jeden Fall die Auswahl der Spalten, die man für die Betrachtung verwenden möchte. Um auf die hier gezeigten Ergebnisse zu kommen, habe ich eine Menge ausprobiert und musste mir einige Gedanken machen.

 Links zum Thema

Keine Kommentare »

No comments yet.

Leave a comment