Zweiter Schritt : Seitenregionen

Auf einer Seite befinden sich verschiedene strukturell sowie inhaltliche unterschiedliche Regionen. Nachdem der Satzspiegel bestimmt und ausgezeichnet wurde, wird das Layout analysiert. Hierbei sind verschiedene Regionen zu unterscheiden und als diese auszuzeichnen:

Wie tief ein Text erfasst werden kann klären die Erfassungs-Level.

Wichtig: Es reicht nicht aus, den kompletten Satzspiegel als eine TextRegion zu identifizieren, sondern die Lokalisierung einzeln abgrenzbarer Blöcke ist vorzunehmen. Damit ist auch eine Trennung von textuellen und nicht-textuellen Segmenten klar zu erkennen.