Metainformationen zur Seite
  •  

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
speedy:30_modules:ocr [2020/01/08 15:22] – [Regelwerk/Einrichtung] speedyspeedy:30_modules:ocr [2020/12/29 12:24] (aktuell) – [OCR] admin
Zeile 1: Zeile 1:
 ====== OCR ====== ====== OCR ======
  
-In speedyPDM gibt es die Möglichkeit eine OCR Indizierung ein zu richten um z.B. Rechnungen oder Angebote automatisch in speedy ein zu pflegen. Um dieses Modul nutzen zu können muss eine Lizenzierung für dieses Modul vorhanden sein.+In speedyPDM gibt es die Möglichkeit eine OCR Indizierung einzurichten, um z.B. Rechnungen oder Angebote automatisch in speedy einzupflegen. Um dieses Modul nutzen zu können muss eine Lizenzierung für dieses Modul vorhanden sein.
 Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen:
  
Zeile 38: Zeile 38:
 |ocr_extscript|Momentan nicht verwendet| |ocr_extscript|Momentan nicht verwendet|
 |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\  - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel <Ben1> \\ \\ - wenn ocr_flag = 1: Dann wird direkt das Ergebnis dieser Abfrage in die Eigenschaft geschrieben. \\ \\ Das Select Statement sollte folgendermaßen aussehen: <code MySql>SELECT [ocr_pattern], [ocr_matchindex], [ocr_propdefault], [ocr_pcontext]</code>| |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\  - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel <Ben1> \\ \\ - wenn ocr_flag = 1: Dann wird direkt das Ergebnis dieser Abfrage in die Eigenschaft geschrieben. \\ \\ Das Select Statement sollte folgendermaßen aussehen: <code MySql>SELECT [ocr_pattern], [ocr_matchindex], [ocr_propdefault], [ocr_pcontext]</code>|
-|ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: 322x201+536x314(Linkes oberes Eck + Rechtes unteres Eck) \\ Hinweis: Dazu das Setting **ocr.deletefiles** auf 0 setzen und im Temp Ordner die dazugehörige .png-Datei in Paint öffnen und die Koordinaten bestimmen.|+|ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: {322,201,536,314} (Linkes oberes Eck + Rechtes unteres Eck) \\ Hinweis: Dazu das Setting **ocr.deletefiles** auf 0 setzen und im Temp Ordner die dazugehörige .png-Datei in Paint öffnen und die Koordinaten bestimmen.|
 |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen.  \\ := 2: Wert der in ocr_propdefault steht wird genommen.   \\ := 3: SQL Statement wird ein Platzhalter ersetzt.|\\ |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen.  \\ := 2: Wert der in ocr_propdefault steht wird genommen.   \\ := 3: SQL Statement wird ein Platzhalter ersetzt.|\\
-\\ 
  
-Beispiel eines Regelwerks für ein Angebot dass die Angebotsnummer herausliest, in einer Angebots-Tabelle nach der Kundennummer sucht, ein Rechtecksauschnitt macht und in diesem Ausschnitt dann das Angebotsdatum sucht.+Beispiel eines Regelwerks für ein Angebot[1] dass die Angebotsnummer herausliest[2], in einer Angebots-Tabelle nach der Kundennummer sucht[3], ein Rechtecksauschnitt macht[4] und in diesem Ausschnitt dann das Angebotsdatum sucht[5].
 \\ \\
 ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^
 |1|0| |0|Angebot| |(Angebot:\s+)([\w]+)|0|-1|doc_doctype|Angebot| | | |2| |1|0| |0|Angebot| |(Angebot:\s+)([\w]+)|0|-1|doc_doctype|Angebot| | | |2|
 |2|1|MMH|0|Angebotsnummer| |(Angebot:\s+)([\w][0-9]+)|2|-1|dm_docno| | | | |1| |2|1|MMH|0|Angebotsnummer| |(Angebot:\s+)([\w][0-9]+)|2|-1|dm_docno| | | | |1|
-|3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | | SELECT kd_nr FROM angebot WHERE ang_nr='<BEN1>';| |3| +|3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | |select kd_name from angebot_db.angebot a inner join angebot_db.kunden k ON a.ang_kunde=k.kd_id where a.ang_nr='<BEN1>';| |3| 
-|4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |322x201+536x314|1|+|4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |{322,201,536,314}|1|
 |5|4|MMH|0|Angebotsdatum| |(Datum:\s)([0-9]+.[0-9]+.[0-9]+)|2|-1|KOMMENTAR| | | | |1| |5|4|MMH|0|Angebotsdatum| |(Datum:\s)([0-9]+.[0-9]+.[0-9]+)|2|-1|KOMMENTAR| | | | |1|
 \\ \\
Zeile 86: Zeile 85:
 |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)|
 |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)|
 +|ocr.zoom| Zoomfaktor der beim Umwandeln von PDF in TIFF verwendet wird um ein besseres OCR Ergebnis zu erzielen. \\ Standardwert := 2.0|