Über
OCR-D Phase III Das OCR-D-Projekt Kontaktieren Sie uns! Blog Publikationen und Vorträge Modulprojekte Daten Erste Teststellung Nutzer*innenumfrage Impressum
Entwickler*innen
Ground Truth Richtlinien PAGE-XML Formatdokumentation Best Practices für Softwareentwicklung in OCR-D Spezifikationen OCR-D/core API Dokumentation
Anwender*innen
Setup Anleitung Nutzeranleitung Workflows Modelle Glossar
FAQ
  en  
Umlaute
Richtlinien zur Transkription für Ground Truth Transcription Guidelines for Ground Truth
OCR-D: DFG-funded Initiative for Optical Character Recognition Development

  • Die Ground-Truth-Guidelines
  • Konventionen für diese Richtlinien
  • Transkription
    • Level 1
    • Level 2
    • Level 3
    • Grundsätzliches zur Transkription
    • Schreibweisen und Sonderzeichen
      • Unterscheidung von I und J
      • Unterscheidung von u/f, u/v und v/u
      • s-Grapheme
      • r-Grapheme
      • Ligaturen
      • Umlaute
        • Level 1
        • Level 2
        • Level 3
      • Kürzungsstriche
      • Diakritika
      • Silbentrennung
    • Zahlen
    • Tabellen
    • Handschriftliche Anmerkungen
    • Zeichensetzung Grundregeln
    • Übersichten und Beispiele
  • Layout und Struktur
  • Dokumentation zum OCR-D Struktur-Ground-Truth
  • Dokumentation zum PAGE XML Format for Page Content
  • Page XML Erweiterungen
  • Impressum

Umlaute

In den Vorlagen können unterschiedliche Schreibungen von Umlaute wie den heute gebräuchlichen Formen Ä, Ö, Ü, ä, ö, ü oder in der Form eines hochgestelltes e vorkommen. Die Transkription wird in den jeweiligen Levels geregelt.

  • Level 1
  • Level 2
  • Level 3
Übergeordnetes Thema: Schreibweisen, spezielle Zeichen und Sonderzeichen
Published by OCR-D.

The guidelines for Ground Truth transcription are based on the OCR-D specs v3.4.0

DFG logo
GitHub | gitter | Wiki | Docker Hub | Technology Watch | sitemap.xml