Metainformationen zur Seite
  •  

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
speedy:30_modules:imaging_ocr [2024/10/11 16:28] – [Konfigurationsparameter] speedyspeedy:30_modules:imaging_ocr [2024/10/11 16:32] (aktuell) speedy
Zeile 45: Zeile 45:
 Tritt ein Fehler bei der Erkennung auf oder passt keine der Regeln wird die Datei ein Fehler-Verzeichnis verschoben. Tritt ein Fehler bei der Erkennung auf oder passt keine der Regeln wird die Datei ein Fehler-Verzeichnis verschoben.
  
-==== Regelwerk/Einrichtung ====+===== Regelwerk/Einrichtung =====
 Um eine OCR Indizierung der Dokumente mit automatischer Verschlagwortung in speedy durchführen zu können muss ein Regelwerk vorhanden sein. Um dieses Regelwerk zu erstellen gibt es einen Regelwerk-Editor. Um eine OCR Indizierung der Dokumente mit automatischer Verschlagwortung in speedy durchführen zu können muss ein Regelwerk vorhanden sein. Um dieses Regelwerk zu erstellen gibt es einen Regelwerk-Editor.
 Der Regelwerk-Editor befindet sich im speedy-Admin unter **Konfiguration->OCR-Regeln**. Im Editor ist es möglich eine Datei (z.B. eine Rechnung, ein Angebot,...) für die eine Regel erstellt werden soll zu öffnen.  Der Regelwerk-Editor befindet sich im speedy-Admin unter **Konfiguration->OCR-Regeln**. Im Editor ist es möglich eine Datei (z.B. eine Rechnung, ein Angebot,...) für die eine Regel erstellt werden soll zu öffnen. 
Zeile 51: Zeile 51:
 Falls schon Regeln definiert wurden und diese zur ausgewählten Datei passen, werden die Regeln farbblich in der Regelstruktur[1] markiert. Somit kann der "Weg" der Indizierung nachverfolgt werden4. Falls schon Regeln definiert wurden und diese zur ausgewählten Datei passen, werden die Regeln farbblich in der Regelstruktur[1] markiert. Somit kann der "Weg" der Indizierung nachverfolgt werden4.
  
-=== Regel ===+==== Regel ====
 Über den Button **Neue Regel** kann eine neue Regel definiert werden. Die Regel kann im Eigenschaften-Fenster[2] bearbeitet und angepasst werden.  Über den Button **Neue Regel** kann eine neue Regel definiert werden. Die Regel kann im Eigenschaften-Fenster[2] bearbeitet und angepasst werden. 
 Wurde die Regel fertig definiert kann über den **Analysieren** Button in der Ribbon-Leiste eine erneute Indizierung durchgeführt werden. Dadurch können Sie verifizieren ob die eben erstellte Regel auch die gewünschten Ergebnisse liefert. Wurde die Regel fertig definiert kann über den **Analysieren** Button in der Ribbon-Leiste eine erneute Indizierung durchgeführt werden. Dadurch können Sie verifizieren ob die eben erstellte Regel auch die gewünschten Ergebnisse liefert.
Zeile 87: Zeile 87:
 [{{:speedy:30_modules:ocr_regeleditor.png?800|OCR-Regeleditor}}] [{{:speedy:30_modules:ocr_regeleditor.png?800|OCR-Regeleditor}}]
  
-===1 Regelstruktur===+==== 1 Regelstruktur ====
 Auf der linken Seite im Dialog werden die bisher eingerichteten Regeln angezeigt. Diese Regeln werden in einer Struktur wie sie abgearbeitet werden dargestellt. Das heißt wenn eine Regel zutrifft werden die dazugehörigen "Kind Regeln" abgearbeitet. Trifft die Regel nicht zu werden die dazugehörigen "Kind Regeln" auch nicht abgearbeitet. Wenn über den Öffnen-Button eine Datei dazu geladen wurde und eine Regel gefunden wurde wird diese Regel farblich markiert. Damit kann man erkennen welche Regel zu diesem Dokument erkannt wurden.  Auf der linken Seite im Dialog werden die bisher eingerichteten Regeln angezeigt. Diese Regeln werden in einer Struktur wie sie abgearbeitet werden dargestellt. Das heißt wenn eine Regel zutrifft werden die dazugehörigen "Kind Regeln" abgearbeitet. Trifft die Regel nicht zu werden die dazugehörigen "Kind Regeln" auch nicht abgearbeitet. Wenn über den Öffnen-Button eine Datei dazu geladen wurde und eine Regel gefunden wurde wird diese Regel farblich markiert. Damit kann man erkennen welche Regel zu diesem Dokument erkannt wurden. 
  
-===2 Eigenschaften===+==== 2 Eigenschaften ====
 Hier werden die dazugehörigen Eigenschaften zu der in der Regelstruktur[1] ausgewählten Regel angezeigt. Die Eigenschaften können dort eingebaut und eingestellt werden.\\ Hier werden die dazugehörigen Eigenschaften zu der in der Regelstruktur[1] ausgewählten Regel angezeigt. Die Eigenschaften können dort eingebaut und eingestellt werden.\\
 Hinweis: Wenn ein Bereich ausgewählt wird werden andere Eigenschaften ignoriert. Eigenschaften die in einem Bereich gesucht werden sollen müssen als "Kinder" der Regel erstellt werden. Hinweis: Wenn ein Bereich ausgewählt wird werden andere Eigenschaften ignoriert. Eigenschaften die in einem Bereich gesucht werden sollen müssen als "Kinder" der Regel erstellt werden.
 Um den gewünschten Bereich einzustellen öffnet sich bei klicken der 3 Punkte in der Bereichs-Zeile ein Dialog. In diesem Dialog kann durch klicken und halten ein Viereck definiert werden dass dann den Bereich beschreibt. Um den gewünschten Bereich einzustellen öffnet sich bei klicken der 3 Punkte in der Bereichs-Zeile ein Dialog. In diesem Dialog kann durch klicken und halten ein Viereck definiert werden dass dann den Bereich beschreibt.
  
-===3 OCR-Text===+==== 3 OCR-Text ====
 In diesem Fenster wird der erkannte OCR-Text eingetragen. Wenn eine Regel unter der Regelstruktur[1] erkannt wurden, diese dort Farblich markiert ist und über eine Pattern-Suche im OCR-Text gefunden wurde, wird der gefundene Text ebenfalls mit der gleichen Farbe markiert. In diesem Fenster wird der erkannte OCR-Text eingetragen. Wenn eine Regel unter der Regelstruktur[1] erkannt wurden, diese dort Farblich markiert ist und über eine Pattern-Suche im OCR-Text gefunden wurde, wird der gefundene Text ebenfalls mit der gleichen Farbe markiert.
  
-===4 Vorschau===+==== 4 Vorschau ====
 In diesem Fenster wird eine ausgewählte und indizierte Datei zur Vorschau angezeigt. In diesem Fenster wird eine ausgewählte und indizierte Datei zur Vorschau angezeigt.
  
  
-==== Konfigurationsparameter ====+===== Konfigurationsparameter =====
 ^Setting^Beschreibung^ ^Setting^Beschreibung^
 |ocr.tesseract.exe | Gibt den Pfad zur Tesseract Exe an. \\ Default: .\\tools\\tesseract\\tesseract.exe | |ocr.tesseract.exe | Gibt den Pfad zur Tesseract Exe an. \\ Default: .\\tools\\tesseract\\tesseract.exe |