zum Inhalt springen

EncycNet

Historisch-enzyklopädisches Informationssystem


Gegenstand des Projektantrags sind Erschließungstechniken zur Integration verschiedenartiger – insbesondere historischer – Enzyklopädien und Lexika in ein umfassendes Informationssystem. Das Ergebnis ist eine "historische Wikipedia", die anhand eines diachronen Konzeptgraphen organisiert und von der Funktionalität semantischer Netze (z. B. WordNet) inspiriert ist. Ziel ist es, heterogene und in unterschiedlicher Art oder Tiefe erschlossene enzyklopädische Werke auf Ebene der in ihnen verhandelten Konzepte zu analysieren und zu integrieren, d. h. unterschiedliche Lemmata, Terme und Eigennamen auf gemeinsame Entitäten zurückzuführen und den Inhalt ihrer Glossen in verschiedene Konzepte und semantische Klassen aufzugliedern. Anhand der so festgestellten Entitäten wird anschließend 1) ein Konzeptgraph in seiner synchronen und diachronen Dimension erzeugt sowie 2) eine Hierarchisierung von Entitäten und Wissen über ihre Relationen zueinander aufgebaut. Die daraus resultierende Ontologie entspricht einem Informationssystem, das detaillierte Abfragen und Inferenzen über die Gesamtheit der Enyzklopädien-Sammlung ermöglicht. Dabei soll jede Entität ihrer Entsprechung in Wikipedia/DBpedia, einer Normdatei (GND) oder zumindest einer semantischen Klasse aus dem Wikipedia-Kategoriensystem zugeordnet werden. Die Entwicklung wird auf Grundlage einer Sammlung historischer deutschsprachiger Texte durchgeführt, die daraus hervorgehenden Erschließungstechniken und Datenmodelle sind prinzipiell jedoch auch zur Erstellung eines mehrsprachigen Systems geeignet und nicht ausschließlich auf den Texttyp der Enzyklopädie beschränkt. Aufgrund der Tiefe der Erschließung, der Modellierung der zeitlichen Dimension sowie der Induktion einer formalisierten Wissensbasis direkt ausgehend vom historischen Material, handelt es sich bei einem solchen Enzyklopädien-Netzwerk um eine neuartige Ressource, die in der Lage ist, die Arbeit von Forschungsgemeinden an der Schnittstelle von Geisteswissenschaft und Informatik nachhaltig zu verändern.