Ausschreibung zur OCR-D-Implementierung online!

Elisabeth Engl Feb 25, 2020 🏷 DFG 🏷 Ausschreibung

Die Ausschreibung für die Implementierung der OCR-D-Software zur Volltextdigitalisierung historischer Drucke ist ab sofort auf den Seiten der Deutschen Forschungsgemeinschaft (DFG) zugänglich.

Das im Herbst 2015 gestartete Koordinierungsprojekt OCR-D hat zum Ziel, zum einen Verfahren zu beschreiben und Richtlinien zu erarbeiten, um einen optimalen Workflow sowie eine möglichst weitreichende Standardisierung von OCR bezogenen Prozessen und Metadaten zu erzielen. Zum anderen soll die vollständige Transformation des schriftlichen deutschen Kulturerbes in eine maschinenlesbare Form (strukturierter Volltext) konzeptionell vorbereitet werden. Vornehmlich betrachtet werden Werke aus den Verzeichnissen der im deutschen Sprachraum erschienenen Drucke des 16.-18. Jahrhunderts (VD) sowie des 19. Jhs. Die VD-Projekte umfassen ca. 1 Mio. Titel, die derzeit digitalisiert und zukünftig mittels einer OCR prozessiert werden sollen.

Die bisherigen Arbeiten in der OCR-D-Initiative haben zu wesentlichen Verbesserungen der Verfahren zur automatischen Text- und Strukturerfassung historischer Drucke geführt. Der Software-Prototyp verspricht durch seinen modularen Aufbau eine flexible Integration in bestehende (bibliothekarische) Workflow- und Digitalisierungssysteme. Die Implementierung der OCR-D-Software in Bibliotheken, Archiven sowie anderen bestandshaltenden bzw. bestandsverarbeitenden Einrichtungen ist folglich der nächste notwendige Schritt, damit die Erzeugung hochqualitativer Volltexte stattfinden kann.

Zentrales Ziel der neuen Ausschreibung ist die Entwicklung (generischer) Implementierungspakete mit akzeptabler Performanz für unterschiedliche Anforderungen. Sie richtet sich vorwiegend an bestandshaltende Einrichtungen, Anträge können bis zum 7. Oktober 2020 bei der DFG eingereicht werden. Bei Interesse an der Ausschreibung nehmen Sie gerne mit uns Kontakt auf.