Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung | ||
speedy:30_modules:ocr [2020/01/08 15:05] – [Regelwerk/Einrichtung] speedy | speedy:30_modules:ocr [2024/10/30 07:35] (aktuell) – [Regelwerk/Einrichtung] speedy | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
====== OCR ====== | ====== OCR ====== | ||
- | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung | + | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung |
Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | ||
Zeile 38: | Zeile 38: | ||
|ocr_extscript|Momentan nicht verwendet| | |ocr_extscript|Momentan nicht verwendet| | ||
|ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | ||
- | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: | + | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: |
|ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | ||
+ | |||
+ | Beispiel eines Regelwerks für ein Angebot[1] dass die Angebotsnummer herausliest[2], | ||
\\ | \\ | ||
- | + | ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | |
- | ^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | + | |1|0| |0|Angebot| |(Angebot: |
- | |0||0|Angebot||(Angebot: | + | |2|1|MMH|0|Angebotsnummer| |(Angebot: |
- | + | |3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | |select kd_name from angebot_db.angebot a inner join angebot_db.kunden k ON a.ang_kunde=k.kd_id where a.ang_nr='< | |
- | + | |4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |{322, | |
- | Creation Code der ocr_rules Tabelle: \\ | + | |5|4|MMH|0|Angebotsdatum| |(Datum: |
+ | \\ | ||
+ | /* Creation Code der ocr_rules Tabelle: \\ | ||
<code MySql> | <code MySql> | ||
CREATE TABLE `ocr_rules` ( | CREATE TABLE `ocr_rules` ( | ||
Zeile 68: | Zeile 72: | ||
COLLATE=' | COLLATE=' | ||
ENGINE=InnoDB | ENGINE=InnoDB | ||
- | </ | + | </ |
===== Settings ===== | ===== Settings ===== | ||
^Setting^Beschreibung^ | ^Setting^Beschreibung^ | ||
Zeile 81: | Zeile 85: | ||
|ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | ||
|ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | ||
+ | |ocr.zoom| Zoomfaktor der beim Umwandeln von PDF in TIFF verwendet wird um ein besseres OCR Ergebnis zu erzielen. \\ Standardwert := 2.0| |