Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung | ||
| speedy:30_modules:ocr [2020/01/08 14:47] – [Regelwerk/Einrichtung] speedy | speedy:30_modules:ocr [2024/10/30 07:35] (aktuell) – [Regelwerk/Einrichtung] speedy | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| ====== OCR ====== | ====== OCR ====== | ||
| - | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung | + | In speedyPDM gibt es die Möglichkeit eine OCR Indizierung |
| Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | Es gibt 2 Möglichkeiten die OCR Funktionalität in speedy zu nutzen: | ||
| Zeile 38: | Zeile 38: | ||
| |ocr_extscript|Momentan nicht verwendet| | |ocr_extscript|Momentan nicht verwendet| | ||
| |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | |ocr_selectstate|Ein Select Statement, dass abgearbeitet wird:\\ \\ - wenn ocr_flag = 3: Dann wird ein Platzhalter in diesem Select Statement durch einen Wert der schon ermittelt wurde ausgetauscht. Dieser Platzhalter wird mit < > Signalisiert. Zum Beispiel < | ||
| - | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: | + | |ocr_sector|Es kann ein Rechteck ausgeschnitten werden um z.B. ein besseres lese Ergebnis zu bekommen. \\ Beispiel: |
| |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | |ocr_flag|gibt an, welcher Wert zu einer Eigenschaft genommen wird: \\ := 1: Wert der durch Regex oder SQL Abfrage ermittelt wurde wird genommen. | ||
| + | |||
| + | Beispiel eines Regelwerks für ein Angebot[1] dass die Angebotsnummer herausliest[2], | ||
| + | \\ | ||
| + | ^ocr_id^ocr_pid^ocr_pcontext^ocr_index^ocr_rulename^ocr_ruledesc^ocr_pattern^ocr_matchindex^ocr_searchlevel^ocr_propname^ocr_propdefault^ocr_extscript^ocr_selectstate^ocr_sector^ocr_flag^ | ||
| + | |1|0| |0|Angebot| |(Angebot: | ||
| + | |2|1|MMH|0|Angebotsnummer| |(Angebot: | ||
| + | |3|1| |0|Kunde|Kunde aus Datenbank suchen| | |-1|kd_nr| | |select kd_name from angebot_db.angebot a inner join angebot_db.kunden k ON a.ang_kunde=k.kd_id where a.ang_nr='< | ||
| + | |4|2|MMH|0|Rechteck| | |3|-1|Rectangle| | | |{322, | ||
| + | |5|4|MMH|0|Angebotsdatum| |(Datum: | ||
| \\ | \\ | ||
| - | Creation Code der ocr_rules Tabelle: \\ | + | /* Creation Code der ocr_rules Tabelle: \\ |
| <code MySql> | <code MySql> | ||
| CREATE TABLE `ocr_rules` ( | CREATE TABLE `ocr_rules` ( | ||
| Zeile 63: | Zeile 72: | ||
| COLLATE=' | COLLATE=' | ||
| ENGINE=InnoDB | ENGINE=InnoDB | ||
| - | </ | + | </ |
| ===== Settings ===== | ===== Settings ===== | ||
| ^Setting^Beschreibung^ | ^Setting^Beschreibung^ | ||
| Zeile 76: | Zeile 85: | ||
| |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | |ocr.color.colored|Gibt an ob die Indizierung Farbig oder Schwarz weiß stattfindet. \\ Default: 1 (Farbig)| | ||
| |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | |ocr.deletefiles|Löscht die erzeugten Dateien im Temp Ordner. \\ Default: 1 (Löschen)| | ||
| + | |ocr.zoom| Zoomfaktor der beim Umwandeln von PDF in TIFF verwendet wird um ein besseres OCR Ergebnis zu erzielen. \\ Standardwert := 2.0| | ||