Class OcrHelper

java.lang.Object
de.elo.mover.main.helper.OcrHelper

public class OcrHelper
extends java.lang.Object

Überschrift: OcrHelper.

Beschreibung: Hilfsmethoden für die OCR-Funktionalität.

Copyright: Copyright (c) ELO Digital Office GmbH 2018 - 2021

  • Constructor Summary

    Constructors
    Constructor Description
    OcrHelper()  
  • Method Summary

    Modifier and Type Method Description
    static boolean checkOcrAvail​(IXconnect ixConnect)
    Meldet zurück, ob die OCR verfügbar ist.
    static void createSearchableFile​(IXconnect ixConnect, java.io.File tiffFile, java.io.File pdfFile, java.lang.String[] languages)
    Erzeugt eine durchsuchbare PDF-Datei aus der angegebenen TIFF-Datei mit Hilfe der ELO OCR.
    static void createSearchableFileForEntry​(IXconnect ixConnect, java.lang.String objId, java.io.File pdfFile, java.lang.String[] languages)
    Erzeugt eine durchsuchbare PDF-Datei aus dem angegebenen Repository Eintrag mit Hilfe der ELO OCR.
    static java.lang.String[] getExternalOcrLanguages​(IXconnect ixConnect)
    Liefert die vorhandenen externen OCR-Sprachen zurück.
    static java.lang.String[] getInternalOcrLanguages​(IXconnect ixConnect)
    Liefert die vorhandenen internen OCR-Sprachen zurück.
    static java.io.File getOcrFile​(java.io.File file)
    Liefert die OCR-Datei für die angegebene Datei zurück.
    static java.lang.String getOcrRect​(IXconnect ixConnect, java.lang.String objId, java.lang.String[] langs, int pageNr, int top, int left, int bottom, int right)
    Liefert den durch die OCR erkannten Text vom angegebenen Rechteck zurück.
    static java.io.File getOcrSubfolder​(java.io.File directory)
    Liefert den Unterordner für die OCR-Dateien zurück.
    static java.lang.String getOcrText​(IXconnect ixConnect, java.lang.String objId, java.lang.String[] langs)
    Liefert den kompletten OCR-Text für das angegebene Dokument zurück.
    static java.lang.String getOcrTextForPage​(IXconnect ixConnect, java.lang.String objId, int pageNr, java.lang.String[] langs)
    Liefert den OCR-Text aus der angegebenen Dokumentseite zurück.
    static double getSkewAngle​(IXconnect ixConnect, java.io.File tiffFile, java.lang.String[] langs)
    Liefert die Ausrichtung der angegebenen TIFF-Datei mit Hilfe der OCR zurück.

    Methods inherited from class java.lang.Object

    clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
  • Constructor Details

    • OcrHelper

      public OcrHelper()
  • Method Details

    • getOcrRect

      public static java.lang.String getOcrRect​(IXconnect ixConnect, java.lang.String objId, java.lang.String[] langs, int pageNr, int top, int left, int bottom, int right) throws byps.RemoteException, java.lang.Exception
      Liefert den durch die OCR erkannten Text vom angegebenen Rechteck zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - ObjektId des Eintrags
      langs - Liste mit OCR-Sprachen
      pageNr - Seitennummer
      top - Obere Grenze des OCR-Rechtecks
      left - Linke Grenze des OCR-Rechtecks
      bottom - Untere Grenze des OCR-Rechtecks
      right - Rechte Grenze des OCR-Rechtecks
      Returns:
      OCR-Text
      Throws:
      byps.RemoteException
      java.lang.Exception
    • getOcrText

      public static java.lang.String getOcrText​(IXconnect ixConnect, java.lang.String objId, java.lang.String[] langs) throws byps.RemoteException, java.lang.Exception
      Liefert den kompletten OCR-Text für das angegebene Dokument zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - Objekt-Id des Eintrags
      langs - Liste mit OCR-Sprachen
      Returns:
      Kompletter OCR-Text
      Throws:
      byps.RemoteException
      java.lang.Exception
    • getOcrTextForPage

      public static java.lang.String getOcrTextForPage​(IXconnect ixConnect, java.lang.String objId, int pageNr, java.lang.String[] langs) throws java.lang.Exception
      Liefert den OCR-Text aus der angegebenen Dokumentseite zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - Id des Dokuments
      pageNr - Seite des Dokuments
      langs - Liste mit OCR-Sprachen
      Returns:
      OCR-Text der Dokumentseite
      Throws:
      java.lang.Exception
    • getSkewAngle

      public static double getSkewAngle​(IXconnect ixConnect, java.io.File tiffFile, java.lang.String[] langs) throws java.io.IOException, java.lang.Exception
      Liefert die Ausrichtung der angegebenen TIFF-Datei mit Hilfe der OCR zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      tiffFile - TIFF-Datei
      langs - Liste mit OCR-Sprachen
      Returns:
      Ausrichtung der TIFF-Datei
      Throws:
      java.io.IOException
      java.lang.Exception
    • createSearchableFile

      public static void createSearchableFile​(IXconnect ixConnect, java.io.File tiffFile, java.io.File pdfFile, java.lang.String[] languages) throws java.lang.Exception
      Erzeugt eine durchsuchbare PDF-Datei aus der angegebenen TIFF-Datei mit Hilfe der ELO OCR.
      Parameters:
      ixConnect - Indexserver-Verbindung
      tiffFile - TIFF-Datei
      pdfFile - Durchsuchbare PDF-Datei
      languages - Liste mit den OCR-Sprachen
      Throws:
      java.lang.Exception
    • createSearchableFileForEntry

      public static void createSearchableFileForEntry​(IXconnect ixConnect, java.lang.String objId, java.io.File pdfFile, java.lang.String[] languages) throws java.lang.Exception
      Erzeugt eine durchsuchbare PDF-Datei aus dem angegebenen Repository Eintrag mit Hilfe der ELO OCR.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - Objekt-ID des Eintrags
      pdfFile - Durchsuchbare PDF-Datei
      languages - Liste mit den OCR-Sprachen
      Throws:
      java.lang.Exception
    • getOcrFile

      public static java.io.File getOcrFile​(java.io.File file) throws java.lang.Exception
      Liefert die OCR-Datei für die angegebene Datei zurück. Diese liegt in einem Unterverzeichnis "ocr" und hat den Dateinamen "Dokumentdatei.ext.ocr".
      Parameters:
      file - Dokumentdatei
      Returns:
      OCR-Datei
      Throws:
      java.lang.Exception
    • getOcrSubfolder

      public static java.io.File getOcrSubfolder​(java.io.File directory) throws java.lang.Exception
      Liefert den Unterordner für die OCR-Dateien zurück.
      Parameters:
      directory - Verzeichnis
      Returns:
      Unterordner für die OCR-Dateien
      Throws:
      java.lang.Exception
    • checkOcrAvail

      public static boolean checkOcrAvail​(IXconnect ixConnect) throws java.lang.Exception
      Meldet zurück, ob die OCR verfügbar ist.
      Parameters:
      ixConnect - Indexserver-Verbindung
      Returns:
      OCR verfügbar
      Throws:
      java.lang.Exception
    • getExternalOcrLanguages

      public static java.lang.String[] getExternalOcrLanguages​(IXconnect ixConnect) throws java.lang.Exception
      Liefert die vorhandenen externen OCR-Sprachen zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      Returns:
      Liste mit den OCR-Sprachen
      Throws:
      java.lang.Exception
    • getInternalOcrLanguages

      public static java.lang.String[] getInternalOcrLanguages​(IXconnect ixConnect) throws java.lang.Exception
      Liefert die vorhandenen internen OCR-Sprachen zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      Returns:
      Liste mit den OCR-Sprachen
      Throws:
      java.lang.Exception