Class OcrHelper

java.lang.Object
de.elo.mover.main.helper.OcrHelper

public class OcrHelper extends Object

Überschrift: OcrHelper.

Beschreibung: Hilfsmethoden für die OCR-Funktionalität.

Copyright: Copyright (c) ELO Digital Office GmbH 2018 - 2021

  • Constructor Details

    • OcrHelper

      public OcrHelper()
  • Method Details

    • getOcrRect

      public static String getOcrRect(IXconnect ixConnect, String objId, String[] langs, int pageNr, int top, int left, int bottom, int right) throws byps.RemoteException, Exception
      Liefert den durch die OCR erkannten Text vom angegebenen Rechteck zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - ObjektId des Eintrags
      langs - Liste mit OCR-Sprachen
      pageNr - Seitennummer
      top - Obere Grenze des OCR-Rechtecks
      left - Linke Grenze des OCR-Rechtecks
      bottom - Untere Grenze des OCR-Rechtecks
      right - Rechte Grenze des OCR-Rechtecks
      Returns:
      OCR-Text
      Throws:
      byps.RemoteException
      Exception
    • getOcrText

      public static String getOcrText(IXconnect ixConnect, String objId, String[] langs) throws byps.RemoteException, Exception
      Liefert den kompletten OCR-Text für das angegebene Dokument zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - Objekt-Id des Eintrags
      langs - Liste mit OCR-Sprachen
      Returns:
      Kompletter OCR-Text
      Throws:
      byps.RemoteException
      Exception
    • getOcrTextForPage

      public static String getOcrTextForPage(IXconnect ixConnect, String objId, int pageNr, String[] langs) throws Exception
      Liefert den OCR-Text aus der angegebenen Dokumentseite zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - Id des Dokuments
      pageNr - Seite des Dokuments
      langs - Liste mit OCR-Sprachen
      Returns:
      OCR-Text der Dokumentseite
      Throws:
      Exception
    • getSkewAngle

      public static double getSkewAngle(IXconnect ixConnect, File tiffFile, String[] langs) throws IOException, Exception
      Liefert die Ausrichtung der angegebenen TIFF-Datei mit Hilfe der OCR zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      tiffFile - TIFF-Datei
      langs - Liste mit OCR-Sprachen
      Returns:
      Ausrichtung der TIFF-Datei
      Throws:
      IOException
      Exception
    • createSearchableFile

      public static void createSearchableFile(IXconnect ixConnect, File tiffFile, File pdfFile, String[] languages) throws Exception
      Erzeugt eine durchsuchbare PDF-Datei aus der angegebenen TIFF-Datei mit Hilfe der ELO OCR.
      Parameters:
      ixConnect - Indexserver-Verbindung
      tiffFile - TIFF-Datei
      pdfFile - Durchsuchbare PDF-Datei
      languages - Liste mit den OCR-Sprachen
      Throws:
      Exception
    • createSearchableFileForEntry

      public static void createSearchableFileForEntry(IXconnect ixConnect, String objId, File pdfFile, String[] languages) throws Exception
      Erzeugt eine durchsuchbare PDF-Datei aus dem angegebenen Repository Eintrag mit Hilfe der ELO OCR.
      Parameters:
      ixConnect - Indexserver-Verbindung
      objId - Objekt-ID des Eintrags
      pdfFile - Durchsuchbare PDF-Datei
      languages - Liste mit den OCR-Sprachen
      Throws:
      Exception
    • getOcrFile

      public static File getOcrFile(File file) throws Exception
      Liefert die OCR-Datei für die angegebene Datei zurück. Diese liegt in einem Unterverzeichnis "ocr" und hat den Dateinamen "Dokumentdatei.ext.ocr".
      Parameters:
      file - Dokumentdatei
      Returns:
      OCR-Datei
      Throws:
      Exception
    • getOcrSubfolder

      public static File getOcrSubfolder(File directory) throws Exception
      Liefert den Unterordner für die OCR-Dateien zurück.
      Parameters:
      directory - Verzeichnis
      Returns:
      Unterordner für die OCR-Dateien
      Throws:
      Exception
    • checkOcrAvail

      public static boolean checkOcrAvail(IXconnect ixConnect) throws Exception
      Meldet zurück, ob die OCR verfügbar ist.
      Parameters:
      ixConnect - Indexserver-Verbindung
      Returns:
      OCR verfügbar
      Throws:
      Exception
    • getExternalOcrLanguages

      public static String[] getExternalOcrLanguages(IXconnect ixConnect) throws Exception
      Liefert die vorhandenen externen OCR-Sprachen zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      Returns:
      Liste mit den OCR-Sprachen
      Throws:
      Exception
    • getInternalOcrLanguages

      public static String[] getInternalOcrLanguages(IXconnect ixConnect) throws Exception
      Liefert die vorhandenen internen OCR-Sprachen zurück.
      Parameters:
      ixConnect - Indexserver-Verbindung
      Returns:
      Liste mit den OCR-Sprachen
      Throws:
      Exception