Class OcrHelper


  • public class OcrHelper
    extends java.lang.Object

    Überschrift: OcrHelper.

    Beschreibung: Hilfsmethoden für die OCR-Funktionalität.

    Copyright: Copyright (c) ELO Digital Office GmbH 2018 - 2019

    • Constructor Summary

      Constructors 
      Constructor Description
      OcrHelper()  
    • Method Summary

      All Methods Static Methods Concrete Methods 
      Modifier and Type Method Description
      static boolean checkOcrAvail​(IXconnect ixConnect)
      Meldet zurück, ob die OCR verfügbar ist.
      static java.lang.String[] getExternalOcrLanguages​(IXconnect ixConnect)
      Liefert die vorhandenen externen OCR-Sprachen zurück.
      static java.lang.String[] getInternalOcrLanguages​(IXconnect ixConnect)
      Liefert die vorhandenen internen OCR-Sprachen zurück.
      static java.io.File getOcrFile​(java.io.File file)
      Liefert die OCR-Datei für die angegebene Datei zurück.
      static java.lang.String getOcrRect​(IXconnect ixConnect, java.lang.String objId, java.lang.String[] langs, int pageNr, int top, int left, int bottom, int right)
      Liefert den durch die OCR erkannten Text vom angegebenen Rechteck zurück.
      static java.io.File getOcrSubfolder​(java.io.File directory)
      Liefert den Unterordner für die OCR-Dateien zurück.
      static java.lang.String getOcrText​(IXconnect ixConnect, java.lang.String objId, java.lang.String[] langs)
      Liefert den kompletten OCR-Text für das angegebene Archivdokument zurück.
      static java.lang.String getOcrTextForPage​(IXconnect ixConnect, java.lang.String objId, int pageNr, java.lang.String[] langs)
      Liefert den OCR-Text aus der angegebenen Dokumentseite zurück.
      static double getSkewAngle​(IXconnect ixConnect, java.io.File tiffFile, java.lang.String[] langs)
      Liefert die Ausrichtung der angegebenen TIFF-Datei mit Hilfe der OCR zurück.
      • Methods inherited from class java.lang.Object

        clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
    • Constructor Detail

      • OcrHelper

        public OcrHelper()
    • Method Detail

      • getOcrRect

        public static java.lang.String getOcrRect​(IXconnect ixConnect,
                                                  java.lang.String objId,
                                                  java.lang.String[] langs,
                                                  int pageNr,
                                                  int top,
                                                  int left,
                                                  int bottom,
                                                  int right)
                                           throws byps.RemoteException,
                                                  java.lang.Exception
        Liefert den durch die OCR erkannten Text vom angegebenen Rechteck zurück.
        Parameters:
        ixConnect - Index Server Verbindung
        objId - ObjektId des Archiveintrags
        langs - Liste mit OCR-Sprachen
        pageNr - Seitennummer
        top - Obere Grenze des OCR-Rechtecks
        left - Linke Grenze des OCR-Rechtecks
        bottom - Untere Grenze des OCR-Rechtecks
        right - Rechte Grenze des OCR-Rechtecks
        Returns:
        OCR-Text
        Throws:
        byps.RemoteException
        java.lang.Exception
      • getOcrText

        public static java.lang.String getOcrText​(IXconnect ixConnect,
                                                  java.lang.String objId,
                                                  java.lang.String[] langs)
                                           throws byps.RemoteException,
                                                  java.lang.Exception
        Liefert den kompletten OCR-Text für das angegebene Archivdokument zurück.
        Parameters:
        ixConnect - Index Server Verbindung
        objId - ObjektId des Archiveintrags
        langs - Liste mit OCR-Sprachen
        Returns:
        Kompletter OCR-Text
        Throws:
        byps.RemoteException
        java.lang.Exception
      • getOcrTextForPage

        public static java.lang.String getOcrTextForPage​(IXconnect ixConnect,
                                                         java.lang.String objId,
                                                         int pageNr,
                                                         java.lang.String[] langs)
                                                  throws java.lang.Exception
        Liefert den OCR-Text aus der angegebenen Dokumentseite zurück.
        Parameters:
        ixConnect - Index Server Verbindung
        objId - Id des Archivdokuments
        pageNr - Seite des Archivdokuments
        langs - Liste mit OCR-Sprachen
        Returns:
        OCR-Text der Dokumentseite
        Throws:
        java.lang.Exception
      • getSkewAngle

        public static double getSkewAngle​(IXconnect ixConnect,
                                          java.io.File tiffFile,
                                          java.lang.String[] langs)
                                   throws java.io.IOException,
                                          java.lang.Exception
        Liefert die Ausrichtung der angegebenen TIFF-Datei mit Hilfe der OCR zurück.
        Parameters:
        ixConnect - Index Server Verbindung
        tiffFile - TIFF-Datei
        langs - Liste mit OCR-Sprachen
        Returns:
        Ausrichtung der TIFF-Datei
        Throws:
        java.io.IOException
        java.lang.Exception
      • getOcrFile

        public static java.io.File getOcrFile​(java.io.File file)
                                       throws java.lang.Exception
        Liefert die OCR-Datei für die angegebene Datei zurück. Diese liegt in einem Unterverzeichnis "ocr" und hat den Dateinamen "Dokumentdatei.ext.ocr".
        Parameters:
        file - Dokumentdatei
        Returns:
        OCR-Datei
        Throws:
        java.lang.Exception
      • getOcrSubfolder

        public static java.io.File getOcrSubfolder​(java.io.File directory)
                                            throws java.lang.Exception
        Liefert den Unterordner für die OCR-Dateien zurück.
        Parameters:
        directory - Verzeichnis
        Returns:
        Unterordner für die OCR-Dateien
        Throws:
        java.lang.Exception
      • checkOcrAvail

        public static boolean checkOcrAvail​(IXconnect ixConnect)
                                     throws java.lang.Exception
        Meldet zurück, ob die OCR verfügbar ist.
        Parameters:
        ixConnect - Index Server Verbindung
        Returns:
        OCR verfügbar
        Throws:
        java.lang.Exception
      • getExternalOcrLanguages

        public static java.lang.String[] getExternalOcrLanguages​(IXconnect ixConnect)
                                                          throws java.lang.Exception
        Liefert die vorhandenen externen OCR-Sprachen zurück.
        Parameters:
        ixConnect - Index Server Verbindung
        Returns:
        Liste mit den OCR-Sprachen
        Throws:
        java.lang.Exception
      • getInternalOcrLanguages

        public static java.lang.String[] getInternalOcrLanguages​(IXconnect ixConnect)
                                                          throws java.lang.Exception
        Liefert die vorhandenen internen OCR-Sprachen zurück.
        Parameters:
        ixConnect - Index Server Verbindung
        Returns:
        Liste mit den OCR-Sprachen
        Throws:
        java.lang.Exception