Über
OCR-D Phase III Das OCR-D-Projekt Kontaktieren Sie uns! Blog Publikationen und Vorträge Modulprojekte Daten Erste Teststellung Nutzer*innenumfrage Impressum
Entwickler*innen
Ground Truth Richtlinien PAGE-XML Formatdokumentation Best Practices für Softwareentwicklung in OCR-D Spezifikationen OCR-D/core API Dokumentation
Anwender*innen
Setup Anleitung Nutzeranleitung Workflows Modelle Glossar
FAQ
  en  
Level 1
Richtlinien zur Transkription für Ground Truth Transcription Guidelines for Ground Truth
OCR-D: DFG-funded Initiative for Optical Character Recognition Development

  • Die Ground-Truth-Guidelines
  • Konventionen für diese Richtlinien
  • Transkription
  • Layout und Struktur
    • Allgemeines
    • Satzspiegel
    • Seitenrand
    • Leserichtung (ReadingOrder)
    • Typographische Besonderheiten
    • Erster Schritt : Die Seitentypen
    • Zweiter Schritt : Seitenregionen
      • Level 1
      • Level 2
      • Verknüpfungen
      • Textregionen (TextRegion)
      • Abbildungen, Fotos (ImageRegion)
      • Buchschmuck, Zeichnungen (GraphicRegion)
      • Trennlinien, Separatoren (SeparatorRegion)
      • Tabellen (TableRegion)
      • Karten (MapRegion)
      • Mathematische Zeichen (MathsRegion)
      • Chemische Symbole (ChemRegion)
      • Noten (MusicRegion)
      • Werbung (AdvertRegion)
      • Schäden, Schmutz, Verfärbungen, Rauschen (NoiseRegion)
      • Sonstiges (UnknownRegion)
  • Dokumentation zum OCR-D Struktur-Ground-Truth
  • Dokumentation zum PAGE XML Format for Page Content
  • Page XML Erweiterungen
  • Impressum

Level 1

Die minimale Erfassung des Ground-Truth beinhaltet:

  • TextRegion (Textregion),
  • ImageRegion (Abbildungen, Fotos),
  • GraphicRegion (Buchschmuck, Zeichnungen),
  • SeparatorRegion (Trennlinien, Separatoren),
  • Sonstiges
Übergeordnetes Thema: Zweiter Schritt : Seitenregionen
Published by OCR-D.

The guidelines for Ground Truth transcription are based on the OCR-D specs v3.4.0

DFG logo
GitHub | gitter | Wiki | Docker Hub | Technology Watch | sitemap.xml