Über
OCR-D Phase III Das OCR-D-Projekt Kontaktieren Sie uns! Blog Publikationen und Vorträge Modulprojekte Daten Erste Teststellung Nutzer*innenumfrage Impressum
Entwickler*innen
Ground Truth Richtlinien PAGE-XML Formatdokumentation Best Practices für Softwareentwicklung in OCR-D Spezifikationen OCR-D/core API Dokumentation
Anwender*innen
Setup Anleitung Nutzeranleitung Workflows Modelle Glossar
FAQ
  en  
Jan 19, 2021
Phase III der OCR-D-Koordinierung bewilligt
Der Antrag des Koordinierungsprojekts für die dritte Phase der OCR-D-Förderinitiative wurde im Januar 2021 von der DFG bewilligt. In Phase III werden die Ergebnisse der vorangegangenen Modulprojekt-Phase optimiert und der produktive Einsatz der OCR-D-Software in der Massendigitalisierung technisch und organisatorisch eingeleitet.
Oct 2, 2020
OCR-D bei der Mini-ELAG
Am 20. Oktober 2020 findet die Mini-ELAG (European Library Automation Group) statt, bei der der Bibliothekare und IT-Fachleute neue Informationstechnologien und ihre Anwendung in Bibliotheken und Dokumentationsszentren diskutieren. OCR-D ist bei der virtuellen Konferenz mit einem Vortrag von Clemens Neudecker (SBB) zu OCR-D: An open ecosystem for improving OCR on historical documents vertreten.
Sep 22, 2020
OCR-D beim virtuellen Workshop FAIR & Co
Vom 7. bis 8. Oktober veranstaltet die AG eHumanities der Union der deutschen Akademien der Wissenschaften in Zusammenarbeit mit der Akademie der Wissenschaften zu Göttingen den Workshop FAIR & Co.: Sicht- und Verfügbarkeit der digitalen Akademieforschung in einer vernetzten Wissenschaftslandschaft. Das OCR-D-Projekt ist mit einem Vortrag von Matthias Boenig (BBAW) zum Thema: Digitale Transformation: OCR-D, Angebot und Vision vertreten. Am Beispiel des Deutschen Textarchivs wird dargestellt, wie das Anwendungsspektrum dieses Referenzkorpus um den Bereich des maschinellen Lernens zur Verbesserung der Zeichen- und Strukturerkennung erweitert werden kann. Das ganze Programm kann auf der Website des Workshop eingesehen werden.
Aug 1, 2020
Workshop der Implementierungsvorhaben
Im Anschluss an das erfolgreiche erste (virtuelle) Treffen der Implementierungsinteressenten findet am 7. August, 9-13 Uhr ein weiterer Workshop zur Vorbereitung der OCR-D-Anträge statt.
Jun 4, 2020
Auftakt der Pilotierungsphase
Wir freuen uns sehr über das große Interesse an der DFG-Ausschreibung zur Implementierung der OCR-D-Software. Als OCR-D-Koordinierungsprojekt werden wir die geplanten Vorhaben von der Pilotierung an begleiten und den von der DFG gewünschten Austausch unter den Interessenten befördern. Zum Auftakt der Pilotierungsphase veranstalten wir am 19. Juni, 9-13 Uhr eine große Videokonferenz, bei der sich alle Interessenten kennenlernen und die Pilotierungsarbeiten abgestimmt werden können. Zu der Videokonferenz sind auch Interessenten willkommen, die selbst keine Absichtserklärung eingereicht haben und derzeit noch auf der Suche nach einem geeigneten Partner sind, mit dem sie sich in die dritte OCR-D-Phase einbringen könnten. Bei Interesse melden Sie sich bitte bis zum 12. Juni unter engl@hab.de zur Videokonferenz an. Wir freuen uns auf die Zusammenarbeit und eine erfolgreiche Pilotierungsphase!
Feb 25, 2020
Ausschreibung zur OCR-D-Implementierung online!
Die Ausschreibung für die Implementierung der OCR-D-Software zur Volltextdigitalisierung historischer Drucke ist ab sofort auf den Seiten der Deutschen Forschungsgemeinschaft (DFG) zugänglich.
Feb 19, 2020
OCR-D bei der DHd in Paderborn
Die OCR-D-Förderinitiative ist mit mehreren Vorträgen auf der DHd 2020 vertreten, die vom 2.-6. März in Paderborn stattfindet. In V15, am 5. März, stellt das OCR-D-Koordinierungsprojekt anhand von vier Thesen zur Volltexttransformation Ergebnisse und Perspektiven der Förderinitiative zur Diskussion. In der gleichen Sektion berichten die Kollegen des Modulprojekts zur Entwicklung eines Modellrepositoriums und einer Automatischen Schriftarterkennung für OCR-D über ihre Erkenntnisse zur Verwendung von Fraktur in deutschsprachigen Büchern. Weitere Informationen zu den Vorträgen finden Sie im Programm der DHd.
Feb 3, 2020
Volltexte – die Zukunft alter Drucke: OCR-D-Workshop in Bonn
Am 12. Februar findet in Bonn der OCR-D-Workshop “Volltexte – die Zukunft alter Drucke” statt. Die Erkenntnisse und Desiderate des DFG-Projekts werden dort einem bereiten Publikum aus Entwicklern, OCR-Experten, Anwendern und Fördergebern vorgestellt und diskutiert.
Nov 20, 2019
Kooperation mit Kitodo vereinbart
Kitodo und OCR-D haben einen Letter of Intent zur Zusammenarbeit bei der koordinierten und nachhaltigen Entwicklung und Bereitstellung von OCR-Softwarelösungen zur Massenvolltextdigitalisierung unterzeichnet. Kitodo ist eine quelloffene Softwaresuite für die Digitalisierung von Kulturgut in bestandshaltenden Einrichtungen und im Bibliotheksbereich weit verbreitet.
Aug 23, 2019
OCR-D bei der ICDAR 2019 in Sydney
Das OCR-D Paper „okralact – a multi-engine Open Source OCR training system“ (Konstantin Baierer, Rui Dong, Clemens Neudecker) wurde für den 5th International Workshop on Historical Document Imaging and Processing HIP 2019 (https://www.primaresearch.org/hip2019/) im Rahmen der ICDAR Konferenz 2019 in Sydney (https://icdar2019.org/) angenommen.
Aug 9, 2019
OCR-D auf EuropeanaTech Insights
Das Online Journal „EuropeanaTech Insights“ widmete aus Anlass der DATeCH 2019 sein letztes Heft dem Thema Optical Character Recognition.
May 13, 2019
Best Paper Award bei der DATeCH 2019 für OCR-D
Bei der in Brüssel veranstalteten internationalen Konferenz “Digital Access to Textual Cultural Heritage 2019” (DATeCH2019) wurde der Beitrag über OCR-D mit dem Titel “OCR-D: An end-to-end open-source OCR framework for historical documents” mit dem Best Paper Award ausgezeichnet. Als Autorinnen und Autoren sind Clemens Neudecker, Konstantin Baierer, Maria Federbusch, Kay-Michael Würzner, Matthias Boenig, Elisa Herrmann und Volker Hartmann verantwortlich.
Aug 31, 2018
OCR-D bis 2020 verlängert
Die Deutsche Forschungsgemeinschaft (DFG) hat eine Verlängerung des Projekts OCR-D für weitere 18 Monate bewilligt. Die neue Förderphase beginnt im Oktober 2018 und endet demnach im März 2020. Diese erfreuliche Nachricht ermöglicht uns zum einen die weitere Unterstützung der Modulprojekte sowie die Zusammenführung der Ergebnisse. Zum anderen können dadurch auch die eigenen Arbeitspakete des Koordinierungsgremiums weitergeführt und vertieft werden.
Mar 28, 2018
Start der 8 Modulprojekte - OCR-D geht in die zweite Projektphase
Vom 05.-06. März fand in der Herzog August Bibliothek in Wolfenbüttel das große Kick-Off-Treffen der Modulprojekte statt, welches offiziell die zweite Phase von OCR-D einläutet.
Mar 6, 2017
Modulprojektausschreibungen online!
Die Ausschreibung für Modulprojekte im Rahmen von OCR-D ist ab sofort online auf der Seite der Deutschen Forschungsgemeinschaft (DFG) zu finden (Link zur Ausschreibung)
Dec 6, 2016
Staatsbibliothek zu Berlin ist neuer Partner von OCR-D
Das Koordinierungsgremium von OCR-D setzt sich aus der Herzog August Bibliothek Wolfenbüttel, der Berlin-Brandenburgischen Akademie der Wissenschaften Berlin, dort insbesondere dem Deutschen Textarchiv, sowie nun der Staatsbibliothek zu Berlin zusammen. Die SBB übernimmt dabei zukünftig die Arbeiten der Bayerischen Staatsbibliothek, die zum 31.08.2016 aus dem Projekt ausgeschieden ist.
Jun 1, 2016
Das OCR-D-Projekt
OCR-D ist ein Koordinierungsprojekt, welches auf die Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) für historische Drucke ausgerichtet ist.
DFG logo
GitHub | gitter | Wiki | Docker Hub | Technology Watch | sitemap.xml