Digital Humanities Curriculum

Inspiriert durch David Venturis ambitioniertes Vorhaben, aus online verfügbaren Kursen und Ressourcen sein eigenes Data-Science-Curriculum zusammenzustellen und damit selbstbestimmt seine Interessen und Ziele zu verfolgen, habe ich beschlossen, mich in ähnlicher Weise an das Feld der Digital Humanities heranzuwagen.

Warum?

Begründet liegt diese Entscheidung in der Erfahrung, die ich während meines ›traditionellen‹ literaturwissenschaftlichen Studiums gemacht habe. Mehrmals sind mir die Digital Humanities in dieser Zeit begegnet, die Auseinandersetzung mit dem Feld verblieb jedoch durchgängig auf einer abstrakten Ebene. Deswegen durchdrang ich die Methodiken und Ansätze, die in diesem Kontext vorgestellt wurden, im Grunde kaum, wodurch ich nicht einmal in die Nähe dessen kam, was man als code literacy (Vgl. Rieder und Röhle 2012, S. 76) bezeichnen kann: ein kritisches Verständnis der Techniken und Methoden der Digital Humanities, ein kritisches Verständnis von Coding in den Geisteswissenschaften.

Zugleich habe ich in Diskussionen mit meinen ›traditionell‹ geisteswissenschaftlichen Kommilitonen immer wieder festgestellt, dass ein gewisses Unbehagen gegenüber den Digital Humanities herrscht, dass sich an den informatischen Anteilen des Bereichs festzumachen scheint, jedoch nie genau spezifiert werden konnte. Offensichtlich sind Monografien und Paper aus den Digital Humanities für ›traditionelle‹ Geisteswissenschaftler häufig irritierend, herrscht doch oft eine ganz andere Schreibweise vor, die mit anderen Argumentationsweisen verbunden ist, als sie in ›klassischen‹ geisteswissenschaftliche Forschungsarbeiten eingesetzt werden. Am deutlichsten zeigt sich diese Teilung in der Beweisführung mit numerischen Daten und graphischen Repräsentationen. (Vgl. zur relativen Inkommensurabilität auch Ramsay 2003).

Der Traum einer transdisziplinären Methodik der Geisteswissenschaften

Eine Annahme, die häufig mit den Digital Humanities verbunden ist, ist die Hoffnung auf einen stärkeren trans- und interdisziplinären Austausch innerhalb der Geisteswissenschaften, ohne dabei die Besonderheiten der einzelnen Fachkulturen zu verlieren. Diese Hoffnung ist nicht unbegründet: Der Einsatz digitaler Methoden ist nicht auf einen Anwendungsfall oder Disziplin beschränkt und es ist bereits zu diesem Zeitpunkt in der Entwicklung ersichtlich, dass die Digital Humanities es systematisch wie konzeptuell vermögen, lange bestehende geisteswissenschaftsinterne Grenzen zu überschreiten (Vgl. Meister 2012, S. 84). Ob jedoch die Reformulierung geisteswissenschaftlicher Probleme in der Form abstrakten Codes einer neuen lingua franca gleichkommt, die notwendigerweise beherrscht werden muss, um in Zukunft geisteswissenschaftliche Forschung zu betreiben (Vgl. Ebd., S. 83), bleibt abzuwarten.

Meines Erachtens wäre es verfehlt, alle geisteswissenschaftliche Forschung unter die Vorzeichen der Informatik zu stellen. Eine solche Entwicklung würde gerade die produktiven Ausdifferenzierungen der einzelnen Disziplinen, die zumeist einer langen Tradition entspringen, negieren. Zudem scheint es kaum zielführend, alle GeisteswissenschaftlerInnen zu InformatikerInnen umzubilden. Eine Annäherung auf Basis digitaler Methoden halte ich trotzdem für möglich. Die Perspektiven und Möglichkeiten im Bereich der Digital Humanities sind immer noch im Anfangsstadium, es geht entsprechend darum, erst einmal auszuprobieren, was möglich ist und was nicht funktioniert.

Entwicklungen und Positionen der Digital Humanities

Seit meinem Studienbeginn im Jahr 2012 hat die Professionalisierung (und auch Professoralisierung) der Digital Humanities immer weiter zugenommen. Seit 2013 gibt es den Verband Digital Humanities im deutschsprachigen Raum und es kommt einem vor, als werde in jedem Jahr ein neuer Bachelor- oder Masterstudiengang in den Digital Humanities geschaffen. Trotzdem steht die Grundsatzfrage, was Digital Humanities ausmacht oder ausmachen soll, weiter im Mittelpunkt vieler fachinterner Diskussionen. Es seien daher an dieser Stelle einige Positionen und Definitionsversuche zu nennen.

Als einer der wichtigsten Wortführer sowie als einer der Begründer der jungen Disziplin gilt Franco Moretti, der 2010 das Stanford Literary Lab gründete und bereits zehn Jahre zuvor den Begriff des Distant Reading prägte, den er fast schon als Kampfbegriff gegen die ›traditionellen‹ Literaturwissenschaften ins Feld führte. Unter Distant Reading versteht Moretti den Fokus auf literarische Einheiten, die entweder deutlich größer (Genre- und Literatursysteme) oder deutlich kleiner (Themen und Tropen) sind als der einzelne Text und die deswegen, so Moretti, nur durch Analysen adäquat erfasst und beschrieben werden können, die sich nicht auf einzelne Texte fokussieren, sondern auf große Textmengen (Vgl. Moretti 2000). Sein polemischer Appell zu Anfang des neuen Jahrtausends lautete: “[W]e know how to read texts, now let’s learn how not to read them.” (Ebd., S. 57).

In den fast zwei Dekaden seit dieser Forderung fand eine Konsolidierung statt, was zu einem mittlerweile deutlich gesetzteren Ton führte. Die Digital Humanities sind im akademischen Alltag angekommen. Eine breite Definition legen etwa Jannidis et. al (2017) vor. Die Autoren beschreiben das Feld als »Summe aller Versuche, die Informationstechniken auf den Gegenstandsbereich der Geisteswissenschaften anzuwenden« (S. 13). Eine Darstellung, die diese Überschneidung zwischen Geisteswissenschaften und Informatik verdeutlicht, findet sich in Patrick Sahles Paper DH Studieren! Auf dem Weg zu einem Kern- und Referenzcurriculum (2013):

Abbildung 1 Sahle (2013), S. 27

Insgesamt lassen sich momentan (mindestens) vier Hauptbereiche der Digital Humanities beschreiben (Vgl. Jannidis et. al. 2017, S. 13):

  1. Digitale Arbeit mit Texten, beispielsweise Text Mining, Topic Modeling, Stilometrie, Editionsphilologie, Korpuslinguistik.
  2. Digitale Arbeit mit nicht-textuellen Medien, beispielsweise die computergestützte Analyse von Bildern, Musik oder Filmen.
  3. Digitale Aufarbeitung von Quellenmaterial für Datenbanken und andere Anwendungen.
  4. Geisteswissenschaftliche Untersuchung neuer(er) Technologien, etwa hinsichtlich der Frage, inwiefern moderne Medien unsere Gesellschaft verändern.

Herangehensweise und Zielstellung

Besonders interessiert bin ich an dem ersten und dem vierten Punkt. Das Curriculum ist jedoch hauptsächlich auf das Erlernen des ersten Punkts ausgerichtet, es soll Grundkenntnisse in Python vermitteln und mit grundlegenden Ansätzen und Methodiken der Korpuslinguistik, sowie aus den Bereichen des Natural Language Processing (NLP) und Machine Learning ergänzen. Die Kurse werden von unterschiedlichen Universitäten beziehungsweise Plattformen angeboten, teilweise sind Inhalte gedoppelt, was jedoch meines Erachtens didaktisch durchaus hilfreich ist. Ich werde im Blog meinen Fortschritt dokumentieren und zudem versuchen, weitere hilfreiche Ressourcen zu finden und vorzustellen. Der Balken zeigt jeweils an, wie weit ich im Kurs fortgeschritten bin.

Die genutzten Kurse lassen sich je als Einführung in den entsprechenden Themenbereich verstehen, sei es im Umgang mit Python oder hinsichtlich spezieller Anwendungsfälle digitaler Methodiken zum Umgang mit großen Text– beziehungsweise Datenmengen. Es geht mir demanch nicht darum, vollumfängliche informatische Kenntnisse anzueignen, sondern eine Befähigung zur selbstständigen Konzeption und Anwendung digitaler Methoden für die Überprüfung und Beantwortung eigener Fragestellungen zu erlangen nebst der Fähigkeit zur kritischen Beurteilung eben jener Techniken und Methoden.

Grundlagenkurse

Programming Foundations with Python
Programming Foundations with Python

Einführung in die objektorientierte Programmierung mit Python mit grundlegenden Einheiten zur Struktur und den Modulen der Standardbibliothek sowie zu Konzept und Anwendung von Funktionen und Klassen. Verschiedene Projekte zum anwendungsorientierten Erlernen algorithmischer Problemlösung.

Abgeschlossen
Abgeschlossen
Bertelsmann Data Science Challenge
Bertelsmann Data Science Challenge Scholarship Course

Dreimonatiger Challenge Course, in dem die Grundlagen der Data Science vermittelt wurden. Grundlegende Konzepte aus den Bereichen deskriptive Statistik, Python und SQL zur Beschreibung, Erforschung und Visualisierung von bereitgestellten Daten.

Abgeschlossen
Abgeschlossen
Harvard CS50
Introduction to Computer Science (CS50)

Einführungskurs in Informatik. Vermittlung der Grundlagen des algorithmischen Denkens und von grundlegenden Konzepten der Informatik (Abstraktion, Datenstrukturen, Softwaretechnik und –sicherheit, Webentwicklung). Einführung in gängige Programmiersprachen (C, Python, SQL sowie HTML/CSS und Javascript).

Unterbrochen
Unterbrochen
Harvard DH101
Introduction to Digital Humanities (DH101)

Einführungskurs in die Digital Humanities. Vermittlung der Grundlagen der Forschung in den Digital Humanities, zeigt verschiedene Projekte und Tools und ihre Entstehung. Weiterhin Unterrichtseinheiten zu Datenakquise, -reinigung und -erstellung, sowie zur Nutzung der Kommandozeile und des Tools Voyant.

Abgeschlossen
Abgeschlossen
The Javascripting English Major
The JavaScripting English Major

Anwendungsorientierter Kurs in JavaScript für English Majors und andere Geisteswissenschafter von Moacir P. de Sá Pereira. Hilfreich insbesondere für die interaktive Vermittlung und Darstellung von geisteswissenschaftlichen Thesen und Ergebnissen im digitalen Raum.

Abgeschlossen
Abgeschlossen

Korpuslinguistik

Sprachtechnologie in den Digital Humanities
Sprachtechnologie in den Digital Humanities

Grundbegriffe und Konzepte der Korpuslinguistik: Worthäufigkeiten, Kollokationen, N-Gramme. Zudem Lerneinheiten zur manuellen und automatischen Korpusannotation (Named-entity recognition (NER), Part-of-Speech-Tagging (POS) und Lemmatisierung).

Abgeschlossen
Abgeschlossen

Natural Language Processing (NLP)

Python for Text Analysis
Python for Text Analysis

Einführung in die Verwendung von Python für Textanalysen des Computational Lexicology and & Terminology Lab der Vrije Universiteit Amsterdam. Ergänzt durch das Arbeitsbuch Introduction to Text Analysis von Brandon Walsh und Sarah Horowitz.

In Bearbeitung
In Bearbeitung
Text Mining and Analytics
Text Mining and Analytics

Techniken und Methoden zur Gewinnung und Analyse von Textdaten (Natural Language Processing), unter anderem Lerneinheiten zu Topic Analysis, Text Clustering und Text Categorization.

Noch nicht begonnen
Noch nicht begonnen

Machine Learning

PyTorch Scholarship Challenge
PyTorch Scholarship Challenge

Zweimonatiger Challenge Course, in dem die Grundlagen des Deep Learning mit der Python-Programmbibliothek PyTorch vermittelt werden. Konstruktion, Training und Anwendung von Machine-Learning-Algorithmen.

Unterbrochen
Unterbrochen
Deep Learning with Python and PyTorch
Deep Learning with Python and PyTorch

Neben Deep Learning mit PyTorch beinhaltet der Kurs auch Einheiten zum Einsatz von Numpy und Pandas für die Nutzung im Bereich Machine Learning.

Noch nicht begonnen
Noch nicht begonnen
rss facebook twitter github gitlab youtube mail spotify lastfm instagram linkedin pinterest medium vimeo stackoverflow reddit quora microphone tinyletter piqd geisterwissenschaft