Skip to Content

Tesseract OCR

alt

Элемент осуществляет подключение к ядру OCR Tesseract. Поддерживается только Tesseract 5-й версии.

Является контейнером для таких OCR-элементов, как Клик текста мышью и Распознать текст.

Свойства

Описание общих свойств элемента см. в разделе Свойства элемента.
Символ * в названии свойства указывает на обязательность его заполнения.

СвойствоТипОписание
OCR:
ЯзыкStringЯзык для извлечения текста из изображения или элемента UI. Указать можно только 1 язык. По умолчанию "eng" (коды можно просмотреть здесь). Папку с языковыми данными нейросети можно скачать.
МасштабDoubleКоэффициент масштабирования изображения. Рекомендуется использовать для небольших изображений. Значение 1.00 соответствует оригинальному размеру. Чем выше число, тем больше масштаб
Путь к даннымПуть к хранилищу данных нейросети, расположенному по ссылке (совместим с версией 5.0)
Вывод:
ПеременнаяLTools.OCR.OCRInstПеременная для хранения ссылки на ядро OCR

Решение проблем

  • При возникновении ошибки с файлом libdl иногда она может быть решена с помощью выполнения команды:
    sudo ln -s /usr/lib/x86_64-linux-gnu/libglu.so.2 /usr/lib/x86_64-linux-gnu/libdl.so
  • В некоторых случаях для работы Tesseract OCR для Linux может потребоваться установка дополнительных пакетов:
    libtesseract-dev
    libleptonica-dev
    liblept5
    После установки пакетов нужно скопировать (и переименовать) файлы:
    /usr/lib/libleptonica.so.6.0.0 -> /app/ProjectName/x64/libleptonica-1.82.0.so
    /usr/lib/libtesseract.so.5.0.3 -> /app/ProjectName/x64/libtesseract50.so