Mapping 19th Lit - Eine Karte
Mapping 19th Lit ist eine Karte, das als Abschlussprojekt von Moacir P. de Sá Pereiras Kurs The JavaScripting English Major, einem JavaScript-Einsteigerkurs, entstand.
Die Karte basiert auf dem Corpus of German-Language Fiction, das 2.753 deutschsprachige Werke der Gutenberg-DE Edition (veröffentlicht 2013) enthält. Davon sind 1.436 während des 19. Jahrhunderts entstanden. Erste Versuche des Geotagging mit spaCy waren wenig erfolgreich, insbesondere wegen des Ressourcenaufwands und der suboptimalen Anpassung auf ein historisches Datenset. Stattdessen wurde eine grobe Liste durch Geotext erstellt und anhand heuristischer Entscheidungen bereinigt (etwa Fälle von False Positives bei Städtenamen, die auch Personennamen sein können). Diese Top-50-Liste wurde zuletzt automatisiert mit Koordinaten versehen.