Transcription Guidelines for Ground Truth OCR-D: DFG-funded Initiative for Optical Character Recognition Development
Wie im Level 1 transkribieren
Wenn der zu transkribierende Text mit Unicodezeichen umgesetzt werden kann, sind diese
ausschließlich zu verwenden.
Außer den vokalischen Ligaturen werden alle Ligaturen aufgespalten.
Kann das Zeichen nur aus der Kombination von zwei Zeichen gebildet werden, ist diese Kombination
zu verwenden.
Kann das Zeichen nicht aus der Kombination von mehreren Zeichen gebildet werden und ist eine
MUFI-Entsprechung
vorhanden, ist MUFI zu verwenden
Können die Möglichkeiten 1, 2, 3 nicht gewählt werden, ist in Abstimmung mit dem
OCR-D-Koordinierungsgremium eine Code-Definition in Nachnutzung gemeinsam getroffener Vereinbarungen
internationaler Großprojekte wie IMPACT, EEBO, ECCO zu verwenden.