Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende ÜberarbeitungLetzte ÜberarbeitungBeide Seiten der Revision | ||
speedy:30_modules:imaging_ocr [2021/05/05 15:24] – [Regelwerk/Einrichtung] speedy | speedy:30_modules:imaging_ocr [2021/07/29 15:31] – [Imaging] speedy | ||
---|---|---|---|
Zeile 4: | Zeile 4: | ||
Die Dateien können per Dateiauswahl ausgewählt werden oder direkt von einem Scanner geladen werden. | Die Dateien können per Dateiauswahl ausgewählt werden oder direkt von einem Scanner geladen werden. | ||
- | Durch eine optische Texterkennung (OCR - Optical Character Recognition) und anschließender Auswertung eines Regelwerks kann die Indizierung weitestgehend automatisiert werden. | + | Durch eine optische Texterkennung ([[https:// |
===== Imaging ===== | ===== Imaging ===== | ||
Die zu importierenden Dateien werden per Dateiauswahl eingesammelt oder direkt per Scanner eingelesen. \\ | Die zu importierenden Dateien werden per Dateiauswahl eingesammelt oder direkt per Scanner eingelesen. \\ | ||
- | [{{: | + | [{{: |
Die Dateien Liste zeigt alle gewählten Dateien an. Die markierte Datei wird zur einfachen Verschlagwortung im großen Vorschaufenster dargestellt. \\ | Die Dateien Liste zeigt alle gewählten Dateien an. Die markierte Datei wird zur einfachen Verschlagwortung im großen Vorschaufenster dargestellt. \\ | ||
Im Bereich " | Im Bereich " | ||
Zeile 17: | Zeile 17: | ||
===== OCR ===== | ===== OCR ===== | ||
- | Mit Hilfe von OCR (Optical Character Recognition) | + | Mit Hilfe von [[https:// |
Durch ein Regelwerk können bestimmte Texte als Dokumenteigenschaften erkannt und zugeordnet werden. Damit ist es möglich Dokumente gleichen Aufbaus automatisch oder zumindest halbautomatisch zu erkennen und in speedyPDM abzulegen. \\ | Durch ein Regelwerk können bestimmte Texte als Dokumenteigenschaften erkannt und zugeordnet werden. Damit ist es möglich Dokumente gleichen Aufbaus automatisch oder zumindest halbautomatisch zu erkennen und in speedyPDM abzulegen. \\ | ||
So können z.B. Eingangsrechnungen, | So können z.B. Eingangsrechnungen, | ||
Zeile 46: | Zeile 46: | ||
==== Regelwerk/ | ==== Regelwerk/ | ||
- | Um eine Ocr Indizierung der Dokumente mit automatischer Verschlagwortung in speedy durchführen zu können muss ein Regelwerk vorhanden sein. Um dieses | + | Um eine OCR Indizierung der Dokumente mit automatischer Verschlagwortung in speedy durchführen zu können muss ein Regelwerk vorhanden sein. Um dieses |
- | Dieser | + | Der Regelwerk-Editor befindet sich im speedy-Admin unter **Konfiguration-> |
- | Klicken sie dazu den Öffnen-Button in der Ribbon-Leiste und wählen sie die Datei aus. Nach dem sie die Datei gewählt haben startet der OCR-Indizierungsmechanismus und liest die Datei ein. | + | Klicken sie dazu den Öffnen-Button in der Ribbon-Leiste und wählen sie eine Datei aus. Nach dem sie die Datei gewählt haben startet der OCR-Indizierungsmechanismus und liest die Datei ein. Nachdem dieser fertig ist und ihre Datei indiziert hat sehen sie ihre Datei in der Vorschau[4] und den extrahierten Text im OCR-Textfenster[3]. |
- | Falls sie schon Regeln definiert | + | Falls schon Regeln definiert |
=== Regel === | === Regel === | ||
- | Über den Button **Neue Regel** kann eine neue Regel definiert werden. | + | Über den Button **Neue Regel** kann eine neue Regel definiert werden. |
- | Haben sie eine Regel fertig definiert kann über den **Analysieren** Button in der Ribbon-Leiste eine erneute Indizierung durchgeführt werden. Dadurch können | + | Wurde die Regel fertig definiert kann über den **Analysieren** Button in der Ribbon-Leiste eine erneute Indizierung durchgeführt werden. Dadurch können |
**__Die Beschreibung einer Regel unterscheidet sich durch 3 Typen:__** \\ | **__Die Beschreibung einer Regel unterscheidet sich durch 3 Typen:__** \\ | ||
- | __1. Fester Standardwert für Speedy-Eigenschaft__ \\ | + | __1. Fester Standardwert für speedy-Eigenschaft__ \\ |
- | Ein fester Standardwert für eine Speedy-Eigenschaft kann Sinnvoll sein um z.B. eine Vorsortierung | + | Ein fester Standardwert für eine speedy-Eigenschaft kann Sinnvoll sein um z.B. eine Vorsortierung |
Einstellungen: | Einstellungen: | ||
* Pattern -> Das gewünschte Regex Pattern | * Pattern -> Das gewünschte Regex Pattern | ||
- | * Match-index -> 0 | ||
- | * Searchlevel -> -1 | ||
* Eigenschaft -> speedy Eigenschaftenname z.B. dm_doctype | * Eigenschaft -> speedy Eigenschaftenname z.B. dm_doctype | ||
* Standardwert -> dazugehöriger Standartwert z.B. B für Baugruppe | * Standardwert -> dazugehöriger Standartwert z.B. B für Baugruppe | ||
Zeile 71: | Zeile 69: | ||
* Pattern -> Das gewünschte Regex Pattern | * Pattern -> Das gewünschte Regex Pattern | ||
* Match-index -> 1 (1.Match des Regex Patterns) | * Match-index -> 1 (1.Match des Regex Patterns) | ||
- | * Searchlevel -> -1 | ||
* Eigenschaft -> speedy Eigenschaftenname z.B. CREATE_DATE | * Eigenschaft -> speedy Eigenschaftenname z.B. CREATE_DATE | ||
* Flag -> Pattern | * Flag -> Pattern | ||
| | ||
- | __3. Wert der über eine SQL-Abfrage aus einer anderen | + | __3. Wert der über eine SQL-Abfrage aus einer Datenbank kommt__ \\ |
Es gibt die Möglichkeit aus einer Datenbank entsprechende Werte auszulesen. Ein Beispiel wäre zum Beispiel das auslesen einer Kundennummer um dann über SQL einen Kundennamen heraus zu finden der in einer ERP-Datenbank steckt. \\ | Es gibt die Möglichkeit aus einer Datenbank entsprechende Werte auszulesen. Ein Beispiel wäre zum Beispiel das auslesen einer Kundennummer um dann über SQL einen Kundennamen heraus zu finden der in einer ERP-Datenbank steckt. \\ | ||
Einstellungen: | Einstellungen: | ||
* Eigenschaft -> speedy Eigenschaftenname z.B. kd_nr | * Eigenschaft -> speedy Eigenschaftenname z.B. kd_nr | ||
- | * Statement -> SQL Statement. In diesem | + | * Statement -> SQL Statement. In diesem |
* Flag -> Statement | * Flag -> Statement | ||
- | <note tip> Um ein bestmögliches Ergebnis zu bekommen wird empfohlen immer den gleichen Scanner zu verwenden, da unterschiedliche Auflösungen, | + | <note tip> |
+ | * Um ein bestmögliches Ergebnis zu bekommen wird empfohlen immer den gleichen Scanner zu verwenden, da unterschiedliche Auflösungen, | ||
+ | * Um Regex-Ausdrücke zu Testen und die Syntax zu erlenen kann die Website [[https:// | ||
+ | </ | ||
Die einzelnen Fenster des Regel-Editors werden nun folgend erklärt: | Die einzelnen Fenster des Regel-Editors werden nun folgend erklärt: | ||
Zeile 91: | Zeile 91: | ||
===2 Eigenschaften=== | ===2 Eigenschaften=== | ||
- | Hier werden die dazugehörigen Eigenschaften zu der in der Regelstruktur(1) ausgewählten Regel angezeigt. Die Eigenschaften können dort eingebaut und eingestellt werden.\\ | + | Hier werden die dazugehörigen Eigenschaften zu der in der Regelstruktur[1] ausgewählten Regel angezeigt. Die Eigenschaften können dort eingebaut und eingestellt werden.\\ |
Hinweis: Wenn ein Bereich ausgewählt wird werden andere Eigenschaften ignoriert. Eigenschaften die in einem Bereich gesucht werden sollen müssen als " | Hinweis: Wenn ein Bereich ausgewählt wird werden andere Eigenschaften ignoriert. Eigenschaften die in einem Bereich gesucht werden sollen müssen als " | ||
Um den gewünschten Bereich einzustellen öffnet sich bei klicken der 3 Punkte in der Bereichs-Zeile ein Dialog. In diesem Dialog kann durch klicken und halten ein Viereck definiert werden dass dann den Bereich beschreibt. | Um den gewünschten Bereich einzustellen öffnet sich bei klicken der 3 Punkte in der Bereichs-Zeile ein Dialog. In diesem Dialog kann durch klicken und halten ein Viereck definiert werden dass dann den Bereich beschreibt. | ||
===3 OCR-Text=== | ===3 OCR-Text=== | ||
- | In diesem Fenster wird der erkannte OCR-Text eingetragen. Wenn eine Regel unter der Regelstruktur(1) erkannt wurden, diese dort Farblich markiert ist und über eine Pattern-Suche im OCR-Text gefunden wurde, wird der gefundene Text ebenfalls mit der gleichen Farbe markiert. | + | In diesem Fenster wird der erkannte OCR-Text eingetragen. Wenn eine Regel unter der Regelstruktur[1] erkannt wurden, diese dort Farblich markiert ist und über eine Pattern-Suche im OCR-Text gefunden wurde, wird der gefundene Text ebenfalls mit der gleichen Farbe markiert. |
===4 Vorschau=== | ===4 Vorschau=== | ||
Zeile 102: | Zeile 102: | ||
- | ==== Settings | + | ==== Konfigurationsparameter |
^Setting^Beschreibung^ | ^Setting^Beschreibung^ | ||
|ocr.tesseract.exe|Gibt den Pfad zur Tesseract Exe an. \\ Default: .\\tools\\tesseract\\tesseract.exe| | |ocr.tesseract.exe|Gibt den Pfad zur Tesseract Exe an. \\ Default: .\\tools\\tesseract\\tesseract.exe| |