OCR via Zotero und Internet Archive
Wissenschaftliche Bibliothek aus Scans
Das unter anderem von der Mellon-Stiftung finanzierte Internet Archive hat sich mit den Schöpfern der freien Firefox-Extension Zotero an der George-Mason-Universität zusammengetan und die Zotero Commons ins Leben gerufen.
Wie Dan Cohen, Leiter des Zentrums für Geschichte und neue Medien der Mason-Universität, am Mittwoch mitteilte, wird Zotero - ein Plug-in, das Wissenschaftlern bei der Quellenverwaltung hilft - im Lauf der kommenden Monate eine Funktion erhalten, über die Beiträger Scans von Artikeln einfach ans Internet Archive schicken können. Dort werden die Artikel via OCR in E-Texte umgewandelt und dem Einsender zurückübermittelt, der sie dann voll durchsuchen und indizieren kann.
Raufladen und teilen
Der umgewandelte Text steht dann lokal als Quelle zur Verfügung, wird aber auch auf dem Internet Archive bereitgehalten werden. Die gescannten Texte müssen allerdings gemeinfrei sein, und der Beiträger muss eine entsprechende Erklärung signieren, bevor der Prozess in Gang kommt. "Wir wollen, dass das versteckte Archiv der Wissenschaftler ans Tageslicht kommt", schreibt Cohen.
Eine weitere Funktion, die in Zusammenarbeit mit dem Internet Archive in Zotero implementiert werden soll, ist die Möglichkeit zum Verweis auf Web-Quellen, die im Internet Archive bereits gespeichert sind. Damit soll die Zitierfähigkeit von Netzquellen verbessert werden. Die Zotero-User können diese Ressourcen auch für andere Nutzer freigeben. Arbeitsgruppen können jedoch auch geschlossene Projektarchive anlegen. Die Initiative sieht aber gern, dass die Dokumente nach Abschluss des Projekts den Commons hinzugefügt werden.
