Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung | ||
speedy:30_modules:ocr [2020/01/08 15:22] – [Regelwerk/Einrichtung] speedy | speedy:30_modules:ocr [2020/12/29 12:24] (aktuell) – [OCR] admin | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
====== OCR ====== | ====== OCR ====== | ||
- | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung | + | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung |
Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | ||
Zeile 38: | Zeile 38: | ||
|ocr_extscript|Momentan nicht verwendet| | |ocr_extscript|Momentan nicht verwendet| | ||
|ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | ||
- | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: | + | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: |
|ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | ||
- | \\ | ||
- | Beispiel eines Regelwerks für ein Angebot dass die Angebotsnummer herausliest, | + | Beispiel eines Regelwerks für ein Angebot[1] dass die Angebotsnummer herausliest[2], in einer Angebots-Tabelle nach der Kundennummer sucht[3], ein Rechtecksauschnitt macht[4] und in diesem Ausschnitt dann das Angebotsdatum sucht[5]. |
\\ | \\ | ||
^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | ||
|1|0| |0|Angebot| |(Angebot: | |1|0| |0|Angebot| |(Angebot: | ||
|2|1|MMH|0|Angebotsnummer| |(Angebot: | |2|1|MMH|0|Angebotsnummer| |(Angebot: | ||
- | |3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | | SELECT kd_nr FROM angebot | + | |3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | |select kd_name from angebot_db.angebot |
- | |4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |322x201+536x314|1| | + | |4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |{322, |
|5|4|MMH|0|Angebotsdatum| |(Datum: | |5|4|MMH|0|Angebotsdatum| |(Datum: | ||
\\ | \\ | ||
Zeile 86: | Zeile 85: | ||
|ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | ||
|ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | ||
+ | |ocr.zoom| Zoomfaktor der beim Umwandeln von PDF in TIFF verwendet wird um ein besseres OCR Ergebnis zu erzielen. \\ Standardwert := 2.0| |