ALEXANDRIA

Foundations for Temporal Retrieval, Exploration and Analytics in Web Archives

Projekt: Forschung

Mitwirkende

Organisationseinheiten

Forschungs-netzwerk anzeigen

Details

Beschreibung

Das Ziel des Projektes ALEXANDRIA (ERC Nr. 339233) ist die Entwicklung von Modellen, Werkzeugen und Technologien, die die relevanten Teile des Web archivieren und Web Archive indexieren, um eine aussagekräftige Suche und Erkundung von Inhalten zu ermöglichen. Im Rahmen des ALEXANDRIA Projektes werden semantische und zeit-orientierte Indexmethoden signifikant weiterentwickelt und mit Wissensrepräsentationen im Web kombiniert, um effiziente Indexierungs-, Such-, und Erkundungsmethoden für Informationen über Ereignisse und Entitäten aus der Vergangenheit zu ermöglichen. Die ALEXANDRIA Testumgebung stellt einen wichtigen Rahmen für die Erforschung, Erkundung und Evaluierung von Konzepten, Methoden und Algorithmen auf Web Archiven dar.

Motivation
Durch die wachsende Bedeutung des World Wide Web werden auch erhebliche Teile unseres kulturellen Erbes im Web eingestellt und konsumiert. Deshalb müssen Einrichtungen, die in der Bewahrung des Kulturerbes engagiert sind ergänzt werden durch Möglichkeiten zur Bewahrung von digitalen Kulturgütern und den Zugriff auf diese durch die Öffentlichkeit ermöglichen. Das Ziel des Projektes ALEXANDRIA ist die Entwicklung von Modellen, Werkzeugen und Technologien, die die relevanten Teile des Web archivieren und Web Archive indexieren, um eine aussagekräftige Suche und Erkundung von Inhalten zu ermöglichen. Während heutige Zugriffsmethoden auf Web Inhalte eine gute Basis darstellen, erfordert der optimale Zugriff auf Web Archive neue Modelle und Algorithmen für die Suche, Erkundung und Analyse der Inhalte, die weit über die Anforderungen an klassischen Webzugriff hinausgehen. Besondere Herausforderzungen sind hierbei die zeitliche Dimension von Web Archiven, die Nutzung von bereits verfügbaren semantischen Informationen als auch die Integration von Informationen aus sozialen Medien und Netzwerken.

Ziel und Ansatz
Im Rahmen des ALEXANDRIA Projektes werden semantische und zeit-orientierte Indexmethoden signifikant weiterentwickelt und mit Wissensrepräsentationen im Web kombiniert, um effiziente Indexierungs-, Such-, und Erkundungsmethoden für Informationen über Ereignisse und Entitäten aus der Vergangenheit zu ermöglichen. Im Rahmen der Arbeiten wird ein spezieller Fokus auf die Evolution dieses Wissens und der zu indexierenden Webinhalte gelegt wobei auch die Diversität und die Unvollständigkeit des Wissens berücksichtigt werden. Zur Unterstützung von langfristigen Analysen und kollaborativen Abfragen auf Web Archiven werden crowdbasierte mit maschinenbasierte Webanalysemethoden kombiniert. Die Nutzung von implizitem Feedback von Benutzern ist essentiell zur Verbesserung der Indexierung, da sie bessere Einsichten während der Verarbeitung dienen und zur besseren Fokussierung der Inhaltsammlung genutzt werden können.

Potentielle Anwendungen
Die ALEXANDRIA Testumgebung stellt einen wichtigen Rahmen für die Erforschung, Erkundung und Evaluierung von Konzepten, Methoden und Algorithmen, wie sie im Projekt entwickelt werden, dar. Sie stellt relevante Kollektionen und Algorithmen zur Verfügung, die weitergehende Forschung und die praktischen Anwendungen der Projektergebnisse für existierende Web Archive, wie beispielsweise dem Internet Archive, Internet Memory Foundation oder den Web Archiven der Europäischen Nationalbibliotheken, demonstrieren.

???details???

AkronymALEXANDRIA
StatusAbgeschlossen
Beginn/Ende1 März 201428 Feb. 2019

!!Funding

Mittelherkunft

Förderprogramm/-linie