Das Labor für Digital Humanities der Eidgenössischen Technischen Hochschule Lausanne (EFPL) ist eine Zusammenarbeit mit Le Temps SA eingegangen. Zusammen wollen sie eine Suchmaschine aufbauen, «die eine neue Weise der Nutzung der in den Archiven des `Journal de Genève`, der `Gazette de Lausanne` und des `Nouveau Quotidien` enthaltenen Informationen ermöglichen soll», teilte das Medienhaus mit. Für die Datenbank, die 200 Jahre umfassen soll, werden nun vier Millionen Artikel semantisch indexiert, indem ihm bestimmte Einzelheiten wie Orte oder Personen zugeordnet werden.
«Wir wollen ein Tool aufbauen, das die Möglichkeit bietet, auf der Grundlage der jüngsten Fortschritte der Computerlinguistik diese sehr umfangreichen Informationen, die in den Pressearchiven enthalten sind, effizient zu nutzen», erklärte Frédéric Kaplan, Leiter des EFPL-Labors. «Wir gehen davon aus, dass unsere Algorithmen imstande sind, beinahe eine Milliarde semantischer Informationen aus dieser Datenbank zu entnehmen.» Die neue Indexierung soll es erlauben, dass die Suche nach dem Namen einer Person nicht allein auf die Artikel beschränkt ist, in denen diese auftaucht, sondern sie soll auch andere Personen, Orte oder Institutionen herausfiltern, mit denen sie in Verbindung steht.
Um die Methodologie und die Fortschritte in Bezug auf die Algorithmen zu gewährleisten, hätten die Partner einen interdisziplinären wissenschaftlichen Ausschuss aus Historikern, Bibliothekaren und Journalisten gebildet, heisst es weiter. «Eines der Ziele dieses innovativen Projekts ist es auch, den Mitarbeitern dieser Sektoren die Möglichkeit zu bieten, viel effizienter mit den Archiven zu arbeiten und diese Suchmethoden in ihre alltäglichen Vorgehensweisen zu integrieren», so Valérie Boagno, die Generaldirektorin der Le Temps SA.