Documentation Index

Fetch the complete documentation index at: https://docs.lobster-world.com/llms.txt

Use this file to discover all available pages before exploring further.

Satzarterkennungen

Prev Next

In jedem Knoten der Quellstruktur können Sie über das Kontextmenü eine oder mehrere Satzarterkennungen definieren. Damit werden dem Parser die Regeln beschrieben, welche Satzarten in welche Knoten gehören. Jede Satzarterkennung besteht aus einer Bedingung und einem Wert.

image-1780043425837.png

Folgende Bedingungen sind wählbar:

  • Ist gleich

  • Beginnt mit

  • Endet mit

  • Enthält

  • Regulärer Ausdruck

  • Ist nicht

  • Beginnt nicht mit

Wenn mehrere Satzarterkennungen für denselben Knoten definiert sind, werden sie ODER-verknüpft.

Für XML-Eingangsdaten ist es notwendig, auch den Feldern eine Satzarterkennung zuzuordnen. Dabei wird immer die Bedingung Ist gleich verwendet.

Ein logischer Datensatz kann über mehrere Textzeilen gehen. Verwenden Sie in diesem Fall einen regulären Ausdruck mit vorangestelltem Operator (?s).

Beachten Sie auch den folgenden Abschnitt "Satzarterkennung: Prüfen und erstellen".

Satzarterkennung: Prüfen und erstellen

Bestimmte Fehler in der Quellstruktur verhindern oder beeinträchtigen das erfolgreiche Parsen der Quelldaten.

  • Fehlende Satzarterkennungen für Knoten, oder auch für Felder bei XML.

  • Fehlende Vererbung der Satzarterkennung zum Eltern-Knoten.

  • Knoten-Eigenschaft Trennzeichen Zeile/Datensatz fehlt oder ist überflüssig.

Sie können diese Fehler prüfen und teilweise automatisch korrigieren. Siehe dazu die Option Satzarterkennungen neu erstellen im Quellstruktur-Menü. Das Verhalten des Tools hängt von der Dokumentenart des Profils ab.

XML

Fehlende Satzarterkennung für Felder und Knoten wird automatisch ergänzt als Ist gleich Feldname/Knotenname. Vererbung zum Eltern-Knoten und Feld-Trennzeichen werden nicht geprüft, weil sie bei Dokumentenart XML nicht relevant sind.

IDoc

Root-Knoten muss mit EDI_ beginnen. Fehlende Satzarterkennung für Knoten wird automatisch ergänzt. Vererbung zum Eltern-Knoten wird geprüft und gegebenenfalls ergänzt. Feld-Trennzeichen sind bei IDoc (da ein Feste-Länge-Format) nicht relevant.

CSV, Datenbank, Excel

Satzarterkennungen in allen Knoten werden geprüft, aber nicht automatisch gesetzt. Die Vererbung zum Eltern-Knoten wird geprüft und gegebenenfalls ergänzt. Feld-Trennzeichen werden geprüft, aber nicht geändert.

Feste Länge

Satzarterkennungen in allen Knoten werden geprüft, aber nicht automatisch gesetzt. Die Vererbung zum Eltern-Knoten wird geprüft und gegebenenfalls ergänzt. Feld-Trennzeichen werden nicht geprüft.

EDIFACT

Satzarterkennungen werden für EDIFACT-Segmente geprüft, aber nicht automatisch gesetzt. Composite-Knoten (enthält Felder, aber keine Unterknoten und Name beginnt mit C oder S, gefolgt von drei Ziffern) werden dabei ignoriert. Vererbung an Eltern-Knoten (Segmentgruppen) wird geprüft, aber nicht automatisch ergänzt. Feld-Trennzeichen sind nicht relevant.

EDIFACT mit Kennzeichen Tradacoms

Die Prüfung ist (bisher) nicht implementiert. Es erscheint eine Fehlermeldung.

X12, BWA

Satzarterkennungen werden geprüft, aber nicht gesetzt. Vererbung an Eltern-Knoten wird geprüft, aber nicht gesetzt.

Eigene Klasse

Es erfolgt keine Prüfung oder Korrektur. Der Eingangsbaum wird ohne Prüfung als fehlerfrei angenommen.

JSON

Es erfolgt keine Prüfung oder Korrektur.

Automatische Ergänzung der Satzarterkennung

Die Satzarterkennung kann nur für “IDoc” und “XML” automatisch gesetzt werden. Nur hier existiert eine plausible Regel, wie die Satzarterkennung lauten muss. Es werden aber nur solche Segmente bei IDoc oder bei XML verändert, die überhaupt keine Satzarterkennung haben. Bestehende Satzarterkennungen werden nicht verändert. Es wird auch nicht geprüft, ob sie sachlich richtig sind, also ob sie zu den Eingangsdaten passen.  HINWEIS : Um alle Satzarterkennungen zu entfernen, können Sie die Funktionalität unter dem Tab Phase 3 > Quellstruktur > Menü > Stapelverarbeitung > Sonstige > Satzarterkennung löschen verwenden.

Automatische Vererbung der Satzarterkennungen

Bei den Dokumentenarten “IDoc”, “CSV”, “Datenbank”, “Excel” und “Feste Länge” überträgt das Tool fehlende Satzarterkennungen automatisch von den Unterknoten zu den Eltern-Knoten. Voraussetzung ist, dass kein anderer nicht behebbarer Fehler aufgetreten ist. Bei “EDIFACT”, “X12” und “BWA” erfolgt nur die Prüfung ohne Veränderung. Für “XML” und “Eigene Klasse” erfolgt keine Prüfung.

Feld-Trennzeichen prüfen

Feld-Trennzeichen sind als Eigenschaften der Quellstruktur-Knoten definiert. Bei der Dokumentenart “Excel” muss das Feld-Trennzeichen für Knoten, die selbst Felder enthalten, ein Semikolon (;) sein, bei “Datenbank” ein Komma (,). Bei “CSV” muss es gesetzt sein, aber es muss nicht das Semikolon sein. Wenn bei CSV der zeitgesteuerte Eingangsagent “Eigene Klasse” mit einer der Klassen DefaultSQLCron oder DefaultFileSQLCron konfiguriert ist, wird auch Semikolon erwartet. Knoten, die selbst keine Felder, sondern nur Unterknoten enthalten (Oberknoten), sollten kein Feld-Trennzeichen haben.

Ergebnis der Prüfung/automatischen Korrektur

Wenn bei einer der Prüfungen ein Fehler auftritt, der nicht korrigiert werden kann, wird das Profil nicht verändert. Eine automatische Korrektur erfolgt also nur, wenn alle erkannten Fehler automatisch korrigiert werden konnten. Jede Änderung wird in die allgemeinen Meldungen des Control Centers geschrieben. In jedem Logeintrag steht dabei der Name des Profils. Die Änderung des Profils wird erst dann dauerhaft, wenn das Profil gespeichert wird.

Gefundene Fehler werden in einem Fehlerdialog angezeigt. Es gibt keine Garantie, dass alle Fehler gezeigt werden. Nach manueller Korrektur eines Fehlers sollte die Prüfung deshalb wiederholt werden.

Wann das Tool nicht verwendet werden soll

In seltenen Ausnahmefällen weicht ein Profil bewusst von den hier dargestellten Regeln in der Quellstruktur ab. In diesen Fällen ist die Prüfung nicht sinnvoll und sollte nicht durchgeführt werden.