Start der 8 Modulprojekte - OCR-D geht in die zweite Projektphase

2018-03-28

Vom 05.-06. März fand in der Herzog August Bibliothek in Wolfenbüttel das große Kick-Off-Treffen der Modulprojekte statt, welches offiziell die zweite Phase von OCR-D einläutet.

Das Koordinierunsggremium von OCR-D traf sich zum ersten Mal mit den zehn Modulprojektnehmern zum gegenseitigen Kennenlernen und zum Vorstellen der geleisteten und geplanten Arbeiten auf beiden Seiten.
In kurzen Präsentationen wurden die Projektantragsinhalte dargestellt und nach Anknüpfungspunkten zwischen den Modulprojekten sowie zum Koordinierungsgremium gesucht. Beim persönlichen Austausch im World Café sowie beim gemeinsamen Abendessen konnten zudem erste projektstrategische Diskussionen angestoßen werden, die uns in naher Zukunft noch begleiten werden.

Von den über 20 eingegangenen Projektanträgen auf die DFG-Ausschreibung im März 2017 wurden Ende des Jahres acht Modulprojekte bewilligt:

Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke: Bildoptimierung
Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)

Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke: Layouterkennung
DFKI

Weiterentwicklung eines semi-automatischen Open-Source-Tools zur Layout-Analyse und Regionen-Extraktion und -Klassifikation (LAREX) von frühen Buchdrucken,
Universität Würzburg

NN/FST – Unsupervised OCR-Postcorrection based on Neural Networks and Finite-state Transducers
Universität Leipzig

Optimierter Einsatz von OCR-Verfahren – Tesseract als Komponente im OCR-D-Workflow
Universität Mannheim

Automatische und semi-automatische Nachkorrektur OCR-erfasster historischer Drucke
Universität München

Entwicklung eines Modellrepositoriums und einer automatischen Schriftarterkennung für OCR-D
Universität Leipzig, Universität Erlangen, Universität Mainz

OLA-HD – Ein OCR-D-Langzeitarchiv für historische Drucke
SUB Göttingen, GWDG Göttingen

Die Modulprojekte haben in der Regel eine Laufzeit von 18 Monaten, ein öffentlicher Abschlussworkshop ist für Juni 2019 geplant. Bis dahin organisiert das Koordinierungsgremium zwei projektinterne Entwicklertreffen, auf denen die bisherigen Arbeitsversionen besprochen werden. Einen Einblick in die Entwicklung bietet auch die GitHub-Seite von OCR-D: https://github.com//ocr-d
Zudem stehen das Koordinierungsgremium und die Modulprojekte in dieser intensiven Arbeitsphase per Videokonferenzen im regelmäßigen Austausch.

Weitere Details zu den einzelnen Modulprojekten und später zu den Entwicklertreffen folgen auf der Seite von OCR-D.

 

Wir freuen uns auf die gemeinsame Zusammenarbeit!

 

Für Fragen und Anregungen: herrmann[at]hab.de