Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende ÜberarbeitungLetzte ÜberarbeitungBeide Seiten der Revision | ||
speedy:30_modules:imaging_ocr [2021/05/05 16:19] – [Regelwerk/Einrichtung] speedy | speedy:30_modules:imaging_ocr [2021/07/29 15:31] – [Imaging] speedy | ||
---|---|---|---|
Zeile 4: | Zeile 4: | ||
Die Dateien können per Dateiauswahl ausgewählt werden oder direkt von einem Scanner geladen werden. | Die Dateien können per Dateiauswahl ausgewählt werden oder direkt von einem Scanner geladen werden. | ||
- | Durch eine optische Texterkennung (OCR - Optical Character Recognition) und anschließender Auswertung eines Regelwerks kann die Indizierung weitestgehend automatisiert werden. | + | Durch eine optische Texterkennung ([[https:// |
===== Imaging ===== | ===== Imaging ===== | ||
Die zu importierenden Dateien werden per Dateiauswahl eingesammelt oder direkt per Scanner eingelesen. \\ | Die zu importierenden Dateien werden per Dateiauswahl eingesammelt oder direkt per Scanner eingelesen. \\ | ||
- | [{{: | + | [{{: |
Die Dateien Liste zeigt alle gewählten Dateien an. Die markierte Datei wird zur einfachen Verschlagwortung im großen Vorschaufenster dargestellt. \\ | Die Dateien Liste zeigt alle gewählten Dateien an. Die markierte Datei wird zur einfachen Verschlagwortung im großen Vorschaufenster dargestellt. \\ | ||
Im Bereich " | Im Bereich " | ||
Zeile 17: | Zeile 17: | ||
===== OCR ===== | ===== OCR ===== | ||
- | Mit Hilfe von OCR (Optical Character Recognition) | + | Mit Hilfe von [[https:// |
Durch ein Regelwerk können bestimmte Texte als Dokumenteigenschaften erkannt und zugeordnet werden. Damit ist es möglich Dokumente gleichen Aufbaus automatisch oder zumindest halbautomatisch zu erkennen und in speedyPDM abzulegen. \\ | Durch ein Regelwerk können bestimmte Texte als Dokumenteigenschaften erkannt und zugeordnet werden. Damit ist es möglich Dokumente gleichen Aufbaus automatisch oder zumindest halbautomatisch zu erkennen und in speedyPDM abzulegen. \\ | ||
So können z.B. Eingangsrechnungen, | So können z.B. Eingangsrechnungen, | ||
Zeile 46: | Zeile 46: | ||
==== Regelwerk/ | ==== Regelwerk/ | ||
- | Um eine OCR Indizierung der Dokumente mit automatischer Verschlagwortung in speedy durchführen zu können muss ein Regelwerk vorhanden sein. Um dieses | + | Um eine OCR Indizierung der Dokumente mit automatischer Verschlagwortung in speedy durchführen zu können muss ein Regelwerk vorhanden sein. Um dieses |
- | Dieser | + | Der Regelwerk-Editor befindet sich im speedy-Admin unter **Konfiguration-> |
- | Klicken sie dazu den Öffnen-Button in der Ribbon-Leiste und wählen sie die Datei aus. Nach dem sie die Datei gewählt haben startet der OCR-Indizierungsmechanismus und liest die Datei ein. | + | Klicken sie dazu den Öffnen-Button in der Ribbon-Leiste und wählen sie eine Datei aus. Nach dem sie die Datei gewählt haben startet der OCR-Indizierungsmechanismus und liest die Datei ein. Nachdem dieser fertig ist und ihre Datei indiziert hat sehen sie ihre Datei in der Vorschau[4] und den extrahierten Text im OCR-Textfenster[3]. |
- | Falls sie schon Regeln definiert | + | Falls schon Regeln definiert |
=== Regel === | === Regel === | ||
- | Über den Button **Neue Regel** kann eine neue Regel definiert werden. | + | Über den Button **Neue Regel** kann eine neue Regel definiert werden. |
- | Haben sie eine Regel fertig definiert kann über den **Analysieren** Button in der Ribbon-Leiste eine erneute Indizierung durchgeführt werden. Dadurch können | + | Wurde die Regel fertig definiert kann über den **Analysieren** Button in der Ribbon-Leiste eine erneute Indizierung durchgeführt werden. Dadurch können |
**__Die Beschreibung einer Regel unterscheidet sich durch 3 Typen:__** \\ | **__Die Beschreibung einer Regel unterscheidet sich durch 3 Typen:__** \\ | ||
- | __1. Fester Standardwert für Speedy-Eigenschaft__ \\ | + | __1. Fester Standardwert für speedy-Eigenschaft__ \\ |
- | Ein fester Standardwert für eine Speedy-Eigenschaft kann Sinnvoll sein um z.B. eine Vorsortierung | + | Ein fester Standardwert für eine speedy-Eigenschaft kann Sinnvoll sein um z.B. eine Vorsortierung |
Einstellungen: | Einstellungen: | ||
* Pattern -> Das gewünschte Regex Pattern | * Pattern -> Das gewünschte Regex Pattern | ||
Zeile 76: | Zeile 76: | ||
Einstellungen: | Einstellungen: | ||
* Eigenschaft -> speedy Eigenschaftenname z.B. kd_nr | * Eigenschaft -> speedy Eigenschaftenname z.B. kd_nr | ||
- | * Statement -> SQL Statement. In diesem | + | * Statement -> SQL Statement. In diesem |
* Flag -> Statement | * Flag -> Statement | ||
Zeile 102: | Zeile 102: | ||
- | ==== Settings | + | ==== Konfigurationsparameter |
^Setting^Beschreibung^ | ^Setting^Beschreibung^ | ||
|ocr.tesseract.exe|Gibt den Pfad zur Tesseract Exe an. \\ Default: .\\tools\\tesseract\\tesseract.exe| | |ocr.tesseract.exe|Gibt den Pfad zur Tesseract Exe an. \\ Default: .\\tools\\tesseract\\tesseract.exe| |