eAQUA: Extraktion von strukturiertem Wissen aus Antiken Quellen für die Altertumswissenschaft

Tuesday, May 17, 2022

eAQUA: Extraktion von strukturiertem Wissen aus Antiken Quellen für die Altertumswissenschaft

[First posted in AWOL 17 February 2015, updated 17 May 2022]

Ziel des BMBF geförderten Projektes eAQUA (2008-2013) war die Anpassung und Nutzung von Verfahren des Text Mining für altgriechische und lateinische Texte. Algorithmenbasierte Verfahren der Textauswertung werden seit einigen Jahren erfolgreich auch für die Analyse altertumswissenschaftlicher Textcorpora angewendet, aber besonders die Anwendung auf griechische Texte stellt dabei - wegen der Eigenart der altgriechischen Sprache (Abbildung von Akzenten, morphologische Wortbildung, Satzstruktur etc.) - eine Neuheit und auch spezielle Herausforderung dar.

Im Rahmen der interdisziplinären Zusammenarbeit zwischen altertumswissenschaftlichen Fächern und der Informatik war das Ziel die Gewinnung von neuem strukturierten Wissen aus antiken bzw. frühneuzeitlichen Quellen und die Weiterentwicklung von Werkzeugen aus dem Bereich des Text Mining. Die hier verwendeten Suchmöglichkeiten (Kookkurrenzsuche, Zitationssuche) gehen über die üblichen Suchmöglichkeiten im Rahmen digitaler Bibliotheken hinaus und ermöglichen die Erschließung von Abhängigkeiten, Einflüssen und Transferwegen des Wissens in großem Umfang: Die Kookkurrenzsuche, vorrangig im eAQUA-Teilprojekt Projekt Atthidographen 2008-2011 entwickelt, zeigt semantische Zusammenhänge an, die Zitationssuche, vorrangig im eAQUA-Teilprojekt Platon 2008-2011 entwickelt, listet Textpassagen auf, die Parallelen zwischen einem Werk und dem gesamten Referenzcorpus darstellen. Beide Tools sind seit 2011 erheblich weiterentwickelt worden und werden hier ohne Zugangsbe- oder –einschränkungen zur Anwendung für frei zugängliche Textcorpora zur Verfügung gestellt.