<>

Publications

Baierer, Konstantin; Dong, Rui; Neudecker, Clemens: okralact – a multi-engine Open Source OCR training system, in: Proceedings of the 5th International Workshop on Historical Document Imaging and Processing, Sydney 20.09.2019, S. 25–30. Online: <https://dl.acm.org/doi/10.1145/3352631.3352638>.
Seuret, Mathias; Limbach, Saskia; Weichselbaumer, Nikolaus; Maier, Andreas; Christlein, Vicent: Dataset of Pages from Early Printed Books with Multiple Font Groups, in: Proceedings of the 5th International Workshop on Historical Document Imaging and Processing, Sydney 20.09.2019, S. 1–6. Online: <https://dl.acm.org/doi/10.1145/3352631.3352640>.
Neudecker, Clemens; Baierer, Konstantin; Federbusch, Maria; Würzner, Kay-Michael; Boenig, Matthias; Herrmann, Elisa; Hartmann, Volker: OCR-D: An end-to-end open source OCR framework for historical documents, in: EuropeanaTech Insight (13), 31.07.2019. Online: <https://pro.europeana.eu/page/issue-13-ocr#ocr-d-an-end-to-end-open-source-ocr-framework-for-historical-documents>.
Neudecker, Clemens; Baierer, Konstantin; Federbusch, Maria; Würzner, Kay-Michael; Boenig, Matthias; Herrmann, Elisa; Hartmann, Volker: OCR-D: An end-to-end open-source OCR framework for historical documents, in: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel 09.05.2019, S. 53–58. Online: <https://dl.acm.org/doi/10.1145/3322905.3322917>.
Boenig, Matthias; Baierer, Konstantin; Hartmann, Volker; Federbusch, Maria; Neudecker, Clemens: Labelling OCR Ground Truth for Usage in Repositories, in: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel 09.05.2019, S. 3–8. Online: <https://dl.acm.org/doi/10.1145/3322905.3322916>.
Englmeier, Tobias; Fink, Florian; Schulz, Klaus: A-I-PoCoTo – Combining automated and interactive OCR postcorrection, in: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel 09.05.2019, S. 19.24. Online: <https://dl.acm.org/doi/10.1145/3322905.3322908>.
Schulz, Klaus; Fink, Florian: Novel software for cleansing digitised historical texts, in: Scientia, 28.11.2018. Online: <https://doi.org/10.26320/SCIENTIA278>.
Sachunsky, Robert; Schiffer, Lena K.; Efer, Thomas; Heyer, Gerhard: Towards Context-Aware Language Models for Historical OCR Post-Correction, in: Conference Abstracts, Galway 12.08.2018. Online: <https://eadh2018.exordo.com/files/papers/92/final_draft/EADH_2018_Proposal_Brief_Final.pdf>.
Boenig, Matthias; Federbusch, Maria; Herrmann, Elisa; Neudecker, Clemens; Würzner, Kay-Michael: Ground Truth: Grundwahrheit oder Ad-Hoc-Lösung? Wo stehen die Digital Humanities?, in: Konferenzabstracts, Köln 28.02.2018, S. 219–223. Online: <http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf#page=221>.
Stäcker, Thomas; Herrmann, Elisa: OCR-D – Koordinierte Förderinitiative zur Weiterentwicklung von OCR-Verfahren, in: Bibliotheksdienst 52 (1), 12.05.2017. Online: <https://doi.org/10.1515/bd-2018-0007>.
Boenig, Matthias; Würzner, Kay-Michael; Binder, Arne; Springmann, Uwe: Über den Mehrwert der Vernetzung von OCR-Verfahren zur Erfassung von Texten des 17. Jahrhunderts, in: Konferenzabstracts, Leipzig 03.11.2016, S. 103–108. Online: <http://dhd2016.de/boa.pdf#page=103>.

Presentations

Engl, Elisabeth: Die OCR-D-Workflowengine, Vortrag, 2. Workshop Retrodigitalisierung zu Effizienz und Qualitätssicherung in Digitalisierungsworkflows, Hannover 18.02.2020. Online: <https://ocr-d.github.io/slides/Retrodigitalisierung-2020-02-18/TIB_Retrodigitalisierung.pdf>.
Neudecker, Clemens; Baierer, Konstantin: Funktionen und Möglichkeiten der OCR-D-Software, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: <https://hackmd.io/@cneud/ocrd-bonn#/>.
Engl, Elisabeth: OCR-D in a Nutshell, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: <https://ocr-d.github.io/slides/Abschlussworkshop-2020/Abschlussworkshop_Überblick.pdf>.
Engl, Elisabeth: Bibliothekarische Digitalisierungspraxis und die OCR-D-Software, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: <https://ocr-d.github.io/slides/Abschlussworkshop-2020/OCR-D_in_Bibliotheken.pdf>.
Boenig, Matthias: Spezifikationen und Lessons Learned, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: <https://ocr-d.github.io/slides/Abschlussworkshop-2020/OCR-D_Spezifikationen_Lessons_Learned.pdf>.
Würzner, Kay-Michael: Multi-source OCR workflows with OCR-D, Vortrag, The Open Islamicate Texts Initiative Workshop, Berwyn 29.01.2020. Online: <https://wrznr.github.io/OpenITI-2020/#1>.
Baierer, Konstantin; Engl, Elisabeth; Luetgen, Michael: OCR(-D) und Kitodo, Vortrag, Kitodo Anwenderworkshop, Hamburg 19.11.2019. Online: <https://hackmd.io/@kba/S1peIVxhH#/>.
Seuret, Mathias; Limbach, Saskia; Weichselbaumer, Nikolaus; Maier, Andreas; Christlein, Vicent: Dataset of Pages from Early Printed Books with Multiple Font Groups, Vortrag, 5. internationaler Workshop zu Historical Document Imaging and Processing HIP 2019 als Teil der ICDAR 2019, Sydney 20.09.2019.
Baierer, Konstantin; Dong, Rui; Neudecker, Clemens: okralact – a multi-engine Open Source OCR training system, Vortrag, 5. internationaler Workshop zu Historical Document Imaging and Processing HIP 2019 als Teil der ICDAR 2019, Sydney 20.09.2019. Online: <https://hackmd.io/@kba/SyiQKUCUH#/>.
Metzger, Noah: Projektabschlusspräsentation, Vortrag, Mannheim 19.09.2019. Online: <https://madoc.bib.uni-mannheim.de/52213/>.
Weil: Tesseract OCR – News, Vortrag, ELAG 2019, Berlin 05.09.2019. Online: <https://www.elag2019.de/talks/2019-05-09-tesseract-elag.pdf>.
Neudecker, Clemens; Baierer, Konstantin; Federbusch, Maria; Würzner, Kay-Michael; Boenig, Matthias; Herrmann, Elisa; Hartmann, Volker: OCR-D: An end-to-end open-source OCR framework for historical documents, Vortrag, DATeCH 2019. 3. internationale Konferenz zu Digital Access to Textual Cultural Heritage 2019, Brüssel 05.09.2019. Online: <https://www.slideshare.net/cneudecker/ocrd-an-endtoend-open-source-ocr-framework-for-historical-printed-documents>.
Englmeier, Tobias; Fink, Florian; Schulz, Klaus: A-I-PoCoTo – Combining automated and interactive OCR postcorrection, Vortrag, DATeCH 2019. 3. internationale Konferenz zu Digital Access to Textual Cultural Heritage 2019, Brüssel 05.09.2019.
Boenig, Matthias; Baierer, Konstantin; Hartmann, Volker; Federbusch, Maria; Neudecker, Clemens: Labelling OCR Ground Truth for Usage in Repositories, Vortrag, DATeCH 2019. 3. internationale Konferenz zu Digital Access to Textual Cultural Heritage 2019, Brüssel 05.09.2019. Online: <https://ocr-d.github.io/slides/2019-05-09-gt/index.html>.
Metzger, Noah; Weil, Stefan: Optimierter Einsatz von OCR-Verfahren – Tesseract als Komponente im OCR-D-Workflow, Workshop, MAD HD, Heidelberg 30.07.2019.
Kamlah, Jan; Weil, Stefan: Forschungsdaten aus Digitalisaten, Vortrag, E-Science-Tage, Heidelberg 28.03.2019. Online: <https://heibox.uni-heidelberg.de/d/31bb269467/files/?p=%2FVortr%C3%A4ge%2FC3_2019-03-28-Kamlah-Weil.pdf>.
Weichselbaumer, Nikolaus; Seuret, Mathias; Limbach, Saskia; Christlein, Vincent; Maier, Andreas: Automatic Font Group Recognition in Early Printed Books, Vortrag, Mainz 25.03.2019.
Baierer, Konstantin; Boenig, Matthias; Hartmann, Volker; Herrmann, Elisa: Vom gedruckten Werk zu elektronischem Volltext, Workshop, DHd 2019, Mainz 25.03.2019. Online: <http://kba.cloud/2019-03-25-dhd/>.
Weil, Stefan: Hands-On Lab digital / Vom Bild zum Text. Automatisierte Texterkennung in historischen Drucken mit der freien Software Tesseract, Workshop, 108. Bibliothekartag, Leipzig 18.03.2019. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/docId/16351>.
Herrmann, Elisa: Von der Vision zur Umsetzung: Der aktuelle Entwicklungsstand von OCR-D, Vortrag, 7. Bibliothekskongress, Leipzig 18.03.2019. Online: <https://www.researchgate.net/publication/332173701_Von_der_Vision_zur_Umsetzung_Der_aktuelle_Entwicklungsstand_von_OCR-D>.
Boenig, Matthias: OCR-D in der Praxis: Ein gemeinsamer Ausblick mit Dienstleistern und Anwendern, Öffentliche Arbeitssitzung, 7. Bibliothekskongress, Leipzig 18.03.2019. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/searchtype/collection/id/17097/docId/16357/start/0/rows/20>.
Würzner, Kay-Michael: Neues aus OCR-D, Vortrag, PhilTag 2018, Würzburg 04.10.2018. Online: <https://ocr-d.github.io/slides/PhilTag-2018/content.md>.
Sachunsky, Robert; Schiffer, Lena K.; Efer, Thomas; Heyer, Gerhard: Towards Context-Aware Language Models for Historical OCR Post-Correction, Posterpräsentation, EADH 2018, Galway 12.08.2018. Online: <https://git.informatik.uni-leipzig.de/ocr-d/poster-eadh2018/blob/master/main.pdf>.
Weil, Stefan: 126 Jahre Zeitung online – Fundgrube für historisch Interessierte und Motor für die Bibliotheks-IT, Vortrag, 107. Bibliothekartag, Berlin 15.06.2018. Online: <https://madoc.bib.uni-mannheim.de/46507/>.
Herrmann, Elisa: Wieviel sind 85% wert: Qualität von OCR- und NER-Verfahren für die Forschung, Vortrag, MWW / DARIAH-DE Expertenworkshop Suchtechnologien, Weimar 24.05.2018. Online: <https://ocr-d.github.io/slides/MWW-2018/MWW-Workshop_Wieviel sind 85% wert_2018-05-24.pdf>.
Baierer, Konstantin; Würzner, Kay-Michael: An open-source framework for integrating multi-source layout and text recognition tools into scalable OCR workflows, Vortrag, Bibliotheca Baltica Symposium, Rostock 10.05.2018. Online: <https://ocr-d.github.io/2018-10-05-baltica/index.html#/>.
Boenig, Matthias; Federbusch, Maria; Herrmann, Elisa; Neudecker, Clemens; Würzner, Kay-Michael: Ground Truth: Grundwahrheit oder Ad-Hoc-Lösung? Wo stehen die Digital Humanities?, Vortrag, DHd 2018, Köln 28.02.2018. Online: <http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf#page=221>.
Würzner, Kay-Michael; Boenig, Matthias: Perspektiven der automatischen Texterfassung als Grundlage wissenschaftlicher Editionen am Beispiel der Brief- und Schriftenausgabe der Bernd Alois Zimmermann-Gesamtausgabe, Workshop, Workshop der AG eHumanities Mainz. Geisteswissenschaftliche Forschungsdaten. Methoden zur digitalen Erfassung, Mainz 19.10.2017. Online: <https://ocr-d.github.io/slides/Akademienunion_2017/slides/ocr-perspektiven.pdf>.
Prabhune, Ajinkya; Neudecker, Clemens: OCR-D Technische Systemarchitektur: Workflows, Repository, Schnittstellen, Vortrag, Karlsruhe 26.09.2017. Online: <https://ocr-d.github.io/slides/OCR-Workshop-2017/slides/systemarchitektur/OCR-D-Workshop-Prabhune-Neudecker.pdf>.
Würzner, Kay-Michael: (Open-Source-)OCR-Workflows, Vortrag, Digital Humanities Kolloquium, Berlin 04.08.2017. Online: <https://edoc.bbaw.de/frontdoor/index/index/docId/2786>.
Stäcker, Thomas; Herrmann, Elisa: OCR-D: Koordinierte Förderinitiative zur Weiterentwicklung von OCR für historische Dokumente, Vortrag, 106. Bibliothekartag, Frankfurt am Main 30.05.2017. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/searchtype/collection/id/16521/rows/10/start/0/facetNumber_author_facet/all/author_facetfq/St%C3%A4cker%2C+Thomas/docId/3004>.
Würzner, Kay-Michael; Boenig, Matthias: Compilation of a Large Ground-Truth Data Set: Using Transkribus, Vortrag, Transkribus User Conference, Wien 11.02.2017. Online: <https://ocr-d.github.io/slides/Transkribus-WS-2017/slides/gt_compilation.pdf>.
Herrmann, Elisa: Aktuelle OCR-Entwicklungen und ihr Einsatz in der Praxis, Vortrag, Berliner Bibliothekswissenschaftliches Kolloquium, Berlin 17.01.2017.
Boenig, Matthias; Würzner, Kay-Michael; Binder, Arne; Springmann, Uwe: Über den Mehrwert der Vernetzung von OCR-Verfahren zur Erfassung von Texten des 17. Jahrhunderts, Vortrag, DHd 2016, Leipzig 03.11.2016. Online: <http://dhd2016.de/boa.pdf#page=103>.
Stäcker, Thomas; Herrmann, Elisa: Kooperationsprojekt zur Weiterentwicklung von OCR-Verfahren, Vortrag, 12. Workshop zur Texterkennung in historischen Dokumenten, Rostock 02.09.2016. Online: <https://ocr-d.github.io/slides/Rostock-2016-02-09/OCR-D_Rostock_09-02-2016.pdf>.
Herrmann, Elisa: OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren, Vortrag, Philtag 13, Würzburg 26.02.2016. Online: <https://ocr-d.github.io/slides/PhilTag-2016/OCR-D_Wurzburg-13PhilTag.pdf>.