In jedem Knoten der Quellstruktur können Sie über das Kontextmenü eine oder mehrere Satzarterkennungen definieren. Damit werden dem Parser die Regeln beschrieben, welche Satzarten in welche Knoten gehören. Jede Satzarterkennung besteht aus einer Bedingung und einem Wert.

Folgende Bedingungen sind wählbar:
Ist gleich
Beginnt mit
Endet mit
Enthält
Regulärer Ausdruck
Ist nicht
Beginnt nicht mit
Wenn mehrere Satzarterkennungen für denselben Knoten definiert sind, werden sie ODER-verknüpft.
Für XML-Eingangsdaten ist es notwendig, auch den Feldern eine Satzarterkennung zuzuordnen. Dabei wird immer die Bedingung Ist gleich verwendet.
Ein logischer Datensatz kann über mehrere Textzeilen gehen. Verwenden Sie in diesem Fall einen regulären Ausdruck mit vorangestelltem Operator (?s).
Beachten Sie auch den folgenden Abschnitt "Satzarterkennung: Prüfen und erstellen".
Satzarterkennung: Prüfen und erstellen
Bestimmte Fehler in der Quellstruktur verhindern oder beeinträchtigen das erfolgreiche Parsen der Quelldaten.
Fehlende Satzarterkennungen für Knoten, oder auch für Felder bei XML.
Fehlende Vererbung der Satzarterkennung zum Eltern-Knoten.
Knoten-Eigenschaft Trennzeichen Zeile/Datensatz fehlt oder ist überflüssig.
Sie können diese Fehler prüfen und teilweise automatisch korrigieren. Siehe dazu die Option Satzarterkennungen neu erstellen im Quellstruktur-Menü. Das Verhalten des Tools hängt von der Dokumentenart des Profils ab.
XML | Fehlende Satzarterkennung für Felder und Knoten wird automatisch ergänzt als Ist gleich Feldname/Knotenname. Vererbung zum Eltern-Knoten und Feld-Trennzeichen werden nicht geprüft, weil sie bei Dokumentenart XML nicht relevant sind. |
IDoc | Root-Knoten muss mit EDI_ beginnen. Fehlende Satzarterkennung für Knoten wird automatisch ergänzt. Vererbung zum Eltern-Knoten wird geprüft und gegebenenfalls ergänzt. Feld-Trennzeichen sind bei IDoc (da ein Feste-Länge-Format) nicht relevant. |
CSV, Datenbank, Excel | Satzarterkennungen in allen Knoten werden geprüft, aber nicht automatisch gesetzt. Die Vererbung zum Eltern-Knoten wird geprüft und gegebenenfalls ergänzt. Feld-Trennzeichen werden geprüft, aber nicht geändert. |
Feste Länge | Satzarterkennungen in allen Knoten werden geprüft, aber nicht automatisch gesetzt. Die Vererbung zum Eltern-Knoten wird geprüft und gegebenenfalls ergänzt. Feld-Trennzeichen werden nicht geprüft. |
EDIFACT | Satzarterkennungen werden für EDIFACT-Segmente geprüft, aber nicht automatisch gesetzt. Composite-Knoten (enthält Felder, aber keine Unterknoten und Name beginnt mit C oder S, gefolgt von drei Ziffern) werden dabei ignoriert. Vererbung an Eltern-Knoten (Segmentgruppen) wird geprüft, aber nicht automatisch ergänzt. Feld-Trennzeichen sind nicht relevant. |
EDIFACT mit Kennzeichen Tradacoms | Die Prüfung ist (bisher) nicht implementiert. Es erscheint eine Fehlermeldung. |
X12, BWA | Satzarterkennungen werden geprüft, aber nicht gesetzt. Vererbung an Eltern-Knoten wird geprüft, aber nicht gesetzt. |
Eigene Klasse | Es erfolgt keine Prüfung oder Korrektur. Der Eingangsbaum wird ohne Prüfung als fehlerfrei angenommen. |
JSON | Es erfolgt keine Prüfung oder Korrektur. |
Automatische Ergänzung der Satzarterkennung
Die Satzarterkennung kann nur für “IDoc” und “XML” automatisch gesetzt werden. Nur hier existiert eine plausible Regel, wie die Satzarterkennung lauten muss. Es werden aber nur solche Segmente bei IDoc oder bei XML verändert, die überhaupt keine Satzarterkennung haben. Bestehende Satzarterkennungen werden nicht verändert. Es wird auch nicht geprüft, ob sie sachlich richtig sind, also ob sie zu den Eingangsdaten passen. HINWEIS : Um alle Satzarterkennungen zu entfernen, können Sie die Funktionalität unter dem Tab Phase 3 > Quellstruktur > ☰ Menü > Stapelverarbeitung > Sonstige > Satzarterkennung löschen verwenden.
Automatische Vererbung der Satzarterkennungen
Bei den Dokumentenarten “IDoc”, “CSV”, “Datenbank”, “Excel” und “Feste Länge” überträgt das Tool fehlende Satzarterkennungen automatisch von den Unterknoten zu den Eltern-Knoten. Voraussetzung ist, dass kein anderer nicht behebbarer Fehler aufgetreten ist. Bei “EDIFACT”, “X12” und “BWA” erfolgt nur die Prüfung ohne Veränderung. Für “XML” und “Eigene Klasse” erfolgt keine Prüfung.
Feld-Trennzeichen prüfen
Feld-Trennzeichen sind als Eigenschaften der Quellstruktur-Knoten definiert. Bei der Dokumentenart “Excel” muss das Feld-Trennzeichen für Knoten, die selbst Felder enthalten, ein Semikolon (;) sein, bei “Datenbank” ein Komma (,). Bei “CSV” muss es gesetzt sein, aber es muss nicht das Semikolon sein. Wenn bei CSV der zeitgesteuerte Eingangsagent “Eigene Klasse” mit einer der Klassen DefaultSQLCron oder DefaultFileSQLCron konfiguriert ist, wird auch Semikolon erwartet. Knoten, die selbst keine Felder, sondern nur Unterknoten enthalten (Oberknoten), sollten kein Feld-Trennzeichen haben.
Ergebnis der Prüfung/automatischen Korrektur
Wenn bei einer der Prüfungen ein Fehler auftritt, der nicht korrigiert werden kann, wird das Profil nicht verändert. Eine automatische Korrektur erfolgt also nur, wenn alle erkannten Fehler automatisch korrigiert werden konnten. Jede Änderung wird in die allgemeinen Meldungen des Control Centers geschrieben. In jedem Logeintrag steht dabei der Name des Profils. Die Änderung des Profils wird erst dann dauerhaft, wenn das Profil gespeichert wird.
Gefundene Fehler werden in einem Fehlerdialog angezeigt. Es gibt keine Garantie, dass alle Fehler gezeigt werden. Nach manueller Korrektur eines Fehlers sollte die Prüfung deshalb wiederholt werden.
Wann das Tool nicht verwendet werden soll
In seltenen Ausnahmefällen weicht ein Profil bewusst von den hier dargestellten Regeln in der Quellstruktur ab. In diesen Fällen ist die Prüfung nicht sinnvoll und sollte nicht durchgeführt werden.