Level 2

Sowohl die konsonantischen Ligaturen (tz, ct, ts, ff etc.) sowie die Ligatur ij als auch die in deutschsprachigen Texten üblichen Ligaturen wie fi, fl, ft, deren Derivate, sowie fk, fj, fh, fb, fz, ll, mm, nn, st, ch, ck, ct, th, tt, tz, kk, Qu, ſi, ſſ, ſt, ſch sind grundsätzlich aufzuspalten.

Um aufgespaltene Ligaturen im Ground-Truth zu erkennen, werden diese Ligaturen als typographische Besonderheiten betrachtet und als diese gekennzeichnet.

Vokalische Ligaturen werden grundsätzlich als ein Zeichen realisiert:

Vorlage Zeichen Beschreibung
ae-Ligatur æhex: æ LATIN SMALL LETTER AE
oe-Ligatur œhex: œ LATIN SMALL LIGATURE OE
AE-Ligatur Æhex: Æ LATIN CAPITAL LETTER AE
OE-Ligatur Œhex: Œ LATIN CAPITAL LIGATURE OE