Regex-Debugger: Problemfälle lösen
Die Automatik versagt? Der Debugger zeigt Ihnen die rohen Daten. Lernen Sie, wie Sie Felder manuell extrahieren und Patterns verstehen.
Manchmal scheitert die Automatik. Ein exotisches Layout, eine seltene Schriftart oder ein kreativer Jobtitel verwirren die KI. Hier kommt der "Regex Debugger" ins Spiel – das Werkzeug für Power-User, um unter die Haube zu schauen.
Was ist der Debugger?
Der Debugger zeigt Ihnen exakt, was die OCR "gesehen" hat (Raw Text) und welche regulären Ausdrücke (Regex) warum angeschlagen haben. Er ist Ihre Rettung, wenn Felder leer bleiben oder falsch zugeordnet wurden.
[PHONE] Match (Score: 0.95): +49 171 1234567
[EMAIL] Match (Score: 1.0): alex@example.com
[NAMER] Confidence Low: "Marketing Manager" (Ignored Title)
So nutzen Sie den Debugger
- Aktivieren: Gehen Sie in die Einstellungen > Debug und aktivieren Sie "Debug Logger". (Hinweis: Dies ist nur temporär und speichert keine Daten, zeigt sie aber im Log an).
- Im Editor: Wechseln Sie nach einem Scan im Editor oben rechts auf den Tab "Regex Parser" (oder "Raw Text").
- Analyse: Hier sehen Sie den rohen Textblock, den Tesseract erkannt hat.
Typische Probleme & Lösungen
Fall 1: "Salat" statt Text
Symptom: Der Text sieht aus wie M@x Mu$termann Gmb#.
Ursache: Schlechte Bildqualität, Rauschen oder eine sehr verschnörkelte Schriftart.
Lösung: Manuell korrigieren. Sie können im "Raw Text"-Feld tippen! Korrigieren Sie den Namen im Textfeld und drücken Sie auf "Erneut parsen" (Reset/Re-Run). Der Parser läuft dann über Ihren korrigierten Text und findet plötzlich alle Felder.
Fall 2: Telefonnummer nicht erkannt
Symptom: Nummer steht auf der Karte, fehlt aber im Formular.
Ursache: Oft ungewöhnliche Trennzeichen (Punkte, Pipes) oder Labels wie "M:" statt "Mobil:".
Fix: Im Raw-Text die Trennzeichen durch Leerzeichen ersetzen. Aus +49.171.555 ein +49 171 555 machen. Parsing neu starten.
Fall 3: E-Mail wird als Webseite erkannt
Symptom: info@firma.de landet im Feld "Webseite".
Ursache: Das "@"-Zeichen wurde von der OCR als "(a)" oder ähnliches erkannt.
Fix: Im Raw-Text das @ wieder einfügen.
Experten-Tipp: Copy & Paste Import
Der Debugger/Editor erlaubt Ihnen auch den umgekehrten Weg: Sie haben eine Signatur in einer E-Mail?
1. Kopieren Sie den E-Mail-Text.
2. Öffnen Sie Kontakte.me und klicken Sie auf "Manuell eingeben" oder leeren Sie den Text-Editor.
3. Fügen Sie die Signatur ein.
4. Die App parst sofort alle Daten heraus.
Das macht den Scanner zu einem mächtigen Zwischenspeicher-Tool für alle Arten von unstrukturierten Kontaktdaten auf Ihrem Desktop.