Über
Aktuelles Über das OCR-D-Projekt Phase II: Projekte Phase III: Projekte Community Publikationen und Vorträge Daten Pilotstudie Nutzer*innenumfrage Kontaktieren Sie uns! Impressum
Technische Dokumentation
Decision Log Ground Truth Richtlinien PAGE-XML Formatdokumentation Best Practices für Softwareentwicklung in OCR-D Spezifikationen OCR-D/core API Dokumentation
Nutzungsinformationen und Anleitungen
Kurzanleitung Installationsanleitung Nutzeranleitung Workflows Modelle QUIVER (Qualitätssicherung) Glossar
FAQ
Suche
Für diese Funktion haben wir Google Programmable Search Engine implementiert. Wenn Sie diese nutzen, beachten Sie bitte, dass Cookies gespeichert werden können und die Datenschutzbestimmungen von Google LLC gelten: https://policies.google.com/privacy
en
Aug 6, 2021
OCR-D Phase III gestartet
Am 30. Juli fand unser Kick-off-Workshop statt, der die Phase III von OCR-D einläutete.
Jun 11, 2021
OCR-D auf dem Bibliothekartag 2021
OCR-D ist auch auf dem diesjährigen Bibliothekartag vertreten, der vom 16.-18. Juni 2021 virtuell sowie an zwei Tagen auch vor Ort in Bremen stattfindet. Das OCR-D-Projekt beteiligt sich mit zwei Vorträgen zum aktuellen Stand in der Förderinitiative sowie zur kollaborativen Erstellung von Trainingsmaterialien.
Jun 10, 2021
Implementierungs- und Modulprojekte bewilligt
Neben dem Antrag des Koordinierungsprojekts wurden von der DFG sieben Implementierungs- und Modulprojekte bewilligt, die in den kommenden Monaten ihre Arbeit aufnehmen werden.
Apr 26, 2021
OCR(-D) & Co startet im Mai
Am 7. Mai 2021 startet OCR(-D) & Co, zu dem OCR-D alle Interessierten einlädt. Bei dem offenen Treffen im Barcamp-Format können sich Entwickler, Nutzer und alle weiteren Interessenten niedrigschwellig über OCR(-D) austauschen.
Jan 19, 2021
Phase III der OCR-D-Koordinierung bewilligt
Der Antrag des Koordinierungsprojekts für die dritte Phase der OCR-D-Förderinitiative wurde im Januar 2021 von der DFG bewilligt. In Phase III werden die Ergebnisse der vorangegangenen Modulprojekt-Phase optimiert und der produktive Einsatz der OCR-D-Software in der Massendigitalisierung technisch und organisatorisch eingeleitet.
Oct 2, 2020
OCR-D bei der Mini-ELAG
Am 20. Oktober 2020 findet die Mini-ELAG (European Library Automation Group) statt, bei der der Bibliothekare und IT-Fachleute neue Informationstechnologien und ihre Anwendung in Bibliotheken und Dokumentationsszentren diskutieren. OCR-D ist bei der virtuellen Konferenz mit einem Vortrag von Clemens Neudecker (SBB) zu OCR-D: An open ecosystem for improving OCR on historical documents vertreten.
Sep 22, 2020
OCR-D beim virtuellen Workshop FAIR & Co
Vom 7. bis 8. Oktober veranstaltet die AG eHumanities der Union der deutschen Akademien der Wissenschaften in Zusammenarbeit mit der Akademie der Wissenschaften zu Göttingen den Workshop FAIR & Co.: Sicht- und Verfügbarkeit der digitalen Akademieforschung in einer vernetzten Wissenschaftslandschaft. Das OCR-D-Projekt ist mit einem Vortrag von Matthias Boenig (BBAW) zum Thema: Digitale Transformation: OCR-D, Angebot und Vision vertreten. Am Beispiel des Deutschen Textarchivs wird dargestellt, wie das Anwendungsspektrum dieses Referenzkorpus um den Bereich des maschinellen Lernens zur Verbesserung der Zeichen- und Strukturerkennung erweitert werden kann. Das ganze Programm kann auf der Website des Workshop eingesehen werden.
Aug 1, 2020
Workshop der Implementierungsvorhaben
Im Anschluss an das erfolgreiche erste (virtuelle) Treffen der Implementierungsinteressenten findet am 7. August, 9-13 Uhr ein weiterer Workshop zur Vorbereitung der OCR-D-Anträge statt.
Jun 4, 2020
Auftakt der Pilotierungsphase
Wir freuen uns sehr über das große Interesse an der DFG-Ausschreibung zur Implementierung der OCR-D-Software. Als OCR-D-Koordinierungsprojekt werden wir die geplanten Vorhaben von der Pilotierung an begleiten und den von der DFG gewünschten Austausch unter den Interessenten befördern. Zum Auftakt der Pilotierungsphase veranstalten wir am 19. Juni, 9-13 Uhr eine große Videokonferenz, bei der sich alle Interessenten kennenlernen und die Pilotierungsarbeiten abgestimmt werden können. Zu der Videokonferenz sind auch Interessenten willkommen, die selbst keine Absichtserklärung eingereicht haben und derzeit noch auf der Suche nach einem geeigneten Partner sind, mit dem sie sich in die dritte OCR-D-Phase einbringen könnten. Bei Interesse melden Sie sich bitte bis zum 12. Juni unter engl@hab.de zur Videokonferenz an. Wir freuen uns auf die Zusammenarbeit und eine erfolgreiche Pilotierungsphase!
Feb 25, 2020
Ausschreibung zur OCR-D-Implementierung online!
Die Ausschreibung für die Implementierung der OCR-D-Software zur Volltextdigitalisierung historischer Drucke ist ab sofort auf den Seiten der Deutschen Forschungsgemeinschaft (DFG) zugänglich.
Feb 19, 2020
OCR-D bei der DHd in Paderborn
Die OCR-D-Förderinitiative ist mit mehreren Vorträgen auf der DHd 2020 vertreten, die vom 2.-6. März in Paderborn stattfindet. In V15, am 5. März, stellt das OCR-D-Koordinierungsprojekt anhand von vier Thesen zur Volltexttransformation Ergebnisse und Perspektiven der Förderinitiative zur Diskussion. In der gleichen Sektion berichten die Kollegen des Modulprojekts zur Entwicklung eines Modellrepositoriums und einer Automatischen Schriftarterkennung für OCR-D über ihre Erkenntnisse zur Verwendung von Fraktur in deutschsprachigen Büchern. Weitere Informationen zu den Vorträgen finden Sie im Programm der DHd.
Feb 3, 2020
Volltexte – die Zukunft alter Drucke: OCR-D-Workshop in Bonn
Am 12. Februar findet in Bonn der OCR-D-Workshop “Volltexte – die Zukunft alter Drucke” statt. Die Erkenntnisse und Desiderate des DFG-Projekts werden dort einem bereiten Publikum aus Entwicklern, OCR-Experten, Anwendern und Fördergebern vorgestellt und diskutiert.
Nov 20, 2019
Kooperation mit Kitodo vereinbart
Kitodo und OCR-D haben einen Letter of Intent zur Zusammenarbeit bei der koordinierten und nachhaltigen Entwicklung und Bereitstellung von OCR-Softwarelösungen zur Massenvolltextdigitalisierung unterzeichnet. Kitodo ist eine quelloffene Softwaresuite für die Digitalisierung von Kulturgut in bestandshaltenden Einrichtungen und im Bibliotheksbereich weit verbreitet.
Aug 23, 2019
OCR-D bei der ICDAR 2019 in Sydney
Das OCR-D Paper „okralact – a multi-engine Open Source OCR training system“ (Konstantin Baierer, Rui Dong, Clemens Neudecker) wurde für den 5th International Workshop on Historical Document Imaging and Processing HIP 2019 (https://www.primaresearch.org/hip2019/) im Rahmen der ICDAR Konferenz 2019 in Sydney (https://icdar2019.org/) angenommen.
Aug 9, 2019
OCR-D auf EuropeanaTech Insights
Das Online Journal „EuropeanaTech Insights“ widmete aus Anlass der DATeCH 2019 sein letztes Heft dem Thema Optical Character Recognition.
May 13, 2019
Best Paper Award bei der DATeCH 2019 für OCR-D
Bei der in Brüssel veranstalteten internationalen Konferenz “Digital Access to Textual Cultural Heritage 2019” (DATeCH2019) wurde der Beitrag über OCR-D mit dem Titel “OCR-D: An end-to-end open-source OCR framework for historical documents” mit dem Best Paper Award ausgezeichnet. Als Autorinnen und Autoren sind Clemens Neudecker, Konstantin Baierer, Maria Federbusch, Kay-Michael Würzner, Matthias Boenig, Elisa Herrmann und Volker Hartmann verantwortlich.
Aug 31, 2018
OCR-D bis 2020 verlängert
Die Deutsche Forschungsgemeinschaft (DFG) hat eine Verlängerung des Projekts OCR-D für weitere 18 Monate bewilligt. Die neue Förderphase beginnt im Oktober 2018 und endet demnach im März 2020. Diese erfreuliche Nachricht ermöglicht uns zum einen die weitere Unterstützung der Modulprojekte sowie die Zusammenführung der Ergebnisse. Zum anderen können dadurch auch die eigenen Arbeitspakete des Koordinierungsgremiums weitergeführt und vertieft werden.
Mar 28, 2018
Start der 8 Modulprojekte - OCR-D geht in die zweite Projektphase
Vom 05.-06. März fand in der Herzog August Bibliothek in Wolfenbüttel das große Kick-Off-Treffen der Modulprojekte statt, welches offiziell die zweite Phase von OCR-D einläutet.
Mar 6, 2017
Modulprojektausschreibungen online!
Die Ausschreibung für Modulprojekte im Rahmen von OCR-D ist ab sofort online auf der Seite der Deutschen Forschungsgemeinschaft (DFG) zu finden (Link zur Ausschreibung)
Dec 6, 2016
Staatsbibliothek zu Berlin ist neuer Partner von OCR-D
Das Koordinierungsgremium von OCR-D setzt sich aus der Herzog August Bibliothek Wolfenbüttel, der Berlin-Brandenburgischen Akademie der Wissenschaften Berlin, dort insbesondere dem Deutschen Textarchiv, sowie nun der Staatsbibliothek zu Berlin zusammen. Die SBB übernimmt dabei zukünftig die Arbeiten der Bayerischen Staatsbibliothek, die zum 31.08.2016 aus dem Projekt ausgeschieden ist.
Jun 1, 2016
Das OCR-D-Projekt
OCR-D ist ein Koordinierungsprojekt, welches auf die Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) für historische Drucke ausgerichtet ist.
DFG logo
GitHub | Gitter | Wiki | Quiver | Docker Hub | Technology Watch | sitemap.xml | Impressum