Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende ÜberarbeitungNächste ÜberarbeitungBeide Seiten der Revision | ||
speedy:30_modules:ocr [2019/05/29 08:32] – [Halbautomatische Indizierung (Imaging)] speedy | speedy:30_modules:ocr [2020/01/09 09:40] – [Regelwerk/Einrichtung] speedy | ||
---|---|---|---|
Zeile 12: | Zeile 12: | ||
===== Halbautomatische Indizierung (Imaging) ===== | ===== Halbautomatische Indizierung (Imaging) ===== | ||
Um für die ersten schritte und das Einstellen des OCR´s auf die verschiedenen Rechnungsarten zu Vereinfachen gibt es im Imaging Dialog die Möglichkeit eine OCR Indizierung durchzuführen. Den Imaging Dialog befindet sich unter **Dokument-> | Um für die ersten schritte und das Einstellen des OCR´s auf die verschiedenen Rechnungsarten zu Vereinfachen gibt es im Imaging Dialog die Möglichkeit eine OCR Indizierung durchzuführen. Den Imaging Dialog befindet sich unter **Dokument-> | ||
- | [{{ speedy: | + | [{{ speedy: |
Um die Indizierung ausführen zu können öffnet man die gewünschte Datei und klickt dann auf den OCR-Button in der Taskleiste.\\ | Um die Indizierung ausführen zu können öffnet man die gewünschte Datei und klickt dann auf den OCR-Button in der Taskleiste.\\ | ||
Des weiteren gibt es die Möglichkeit eine oder mehrere Dateien direkt mit einer OCR-Indizierung zu öffnen. Dafür ist der Öffnen Button mit OCR.\\ \\ | Des weiteren gibt es die Möglichkeit eine oder mehrere Dateien direkt mit einer OCR-Indizierung zu öffnen. Dafür ist der Öffnen Button mit OCR.\\ \\ | ||
Konnten Eigenschaften aus der Datei gelesen werden, werden sie nach der Indizierung links angezeigt. Dies bedeutet dass Dokumentennummer, | Konnten Eigenschaften aus der Datei gelesen werden, werden sie nach der Indizierung links angezeigt. Dies bedeutet dass Dokumentennummer, | ||
- | \\ \\ \\ \\ | + | \\ \\ \\ |
- | \\ \\ \\ \\ \\ | + | |
===== Vollautomatische Indizierung ===== | ===== Vollautomatische Indizierung ===== | ||
Um OCR Vollautomatisch zu nutzen wird der speedy-Spooler verwendet. Dieser Überwacht ein Verzwichnis in dass z.B. Rechnungen direkt vom Drucker aus kommen und arbeitet dieses dann sofort ab sobald Dateien sich darin befinden. Damit ist es möglich einen Automatischen Import zu realisieren. | Um OCR Vollautomatisch zu nutzen wird der speedy-Spooler verwendet. Dieser Überwacht ein Verzwichnis in dass z.B. Rechnungen direkt vom Drucker aus kommen und arbeitet dieses dann sofort ab sobald Dateien sich darin befinden. Damit ist es möglich einen Automatischen Import zu realisieren. | ||
===== Regelwerk/ | ===== Regelwerk/ | ||
- | Die OCR Indizierung wird durch ein Regelwerk, dass in der Datenbank beschrieben ist durchgeführt. Dieses Regelwerk steht in der ocr_rules Tabelle. Das Regelwerk wird nach einander abgearbeitet, | + | Die OCR Indizierung wird durch ein Regelwerk, dass in der Datenbank beschrieben ist durchgeführt. Dieses Regelwerk steht in der ocr_rules Tabelle. Das Regelwerk wird nach einander abgearbeitet, |
Die ocr_rules Tabelle hat folgende Spalten: | Die ocr_rules Tabelle hat folgende Spalten: | ||
^Spalte^Beschreibung^ | ^Spalte^Beschreibung^ | ||
Zeile 38: | Zeile 38: | ||
|ocr_extscript|Momentan nicht verwendet| | |ocr_extscript|Momentan nicht verwendet| | ||
|ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | ||
- | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: 322x201+536x314(Linkes oberes Eck + Rechtes unteres Eck)| | + | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: 322x201+536x314(Linkes oberes Eck + Rechtes unteres Eck) \\ Hinweis: Dazu das Setting **ocr.deletefiles** auf 0 setzen und im Temp Ordner die dazugehörige .png-Datei in Paint öffnen und die Koordinaten bestimmen.| |
|ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | ||
+ | |||
+ | Beispiel eines Regelwerks für ein Angebot[1] dass die Angebotsnummer herausliest[2], | ||
+ | \\ | ||
+ | ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | ||
+ | |1|0| |0|Angebot| |(Angebot: | ||
+ | |2|1|MMH|0|Angebotsnummer| |(Angebot: | ||
+ | |3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | |select kd_name from angebot_db.angebot a inner join angebot_db.kunden k ON a.ang_kunde=k.kd_id where a.ang_nr='< | ||
+ | |4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |322x201+536x314|1| | ||
+ | |5|4|MMH|0|Angebotsdatum| |(Datum: | ||
\\ | \\ | ||
Creation Code der ocr_rules Tabelle: \\ | Creation Code der ocr_rules Tabelle: \\ |