Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung | ||
speedy:30_modules:ocr [2020/01/08 14:47] – [Regelwerk/Einrichtung] speedy | speedy:30_modules:ocr [2020/12/29 12:24] (aktuell) – [OCR] admin | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
====== OCR ====== | ====== OCR ====== | ||
- | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung | + | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung |
Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | ||
Zeile 38: | Zeile 38: | ||
|ocr_extscript|Momentan nicht verwendet| | |ocr_extscript|Momentan nicht verwendet| | ||
|ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | ||
- | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: | + | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: |
|ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | ||
+ | |||
+ | Beispiel eines Regelwerks für ein Angebot[1] dass die Angebotsnummer herausliest[2], | ||
+ | \\ | ||
+ | ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | ||
+ | |1|0| |0|Angebot| |(Angebot: | ||
+ | |2|1|MMH|0|Angebotsnummer| |(Angebot: | ||
+ | |3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | |select kd_name from angebot_db.angebot a inner join angebot_db.kunden k ON a.ang_kunde=k.kd_id where a.ang_nr='< | ||
+ | |4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |{322, | ||
+ | |5|4|MMH|0|Angebotsdatum| |(Datum: | ||
\\ | \\ | ||
Creation Code der ocr_rules Tabelle: \\ | Creation Code der ocr_rules Tabelle: \\ | ||
Zeile 76: | Zeile 85: | ||
|ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | ||
|ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | ||
+ | |ocr.zoom| Zoomfaktor der beim Umwandeln von PDF in TIFF verwendet wird um ein besseres OCR Ergebnis zu erzielen. \\ Standardwert := 2.0| |