Tesseract OCR

alt

Элемент осуществляет подключение к ядру OCR Tesseract. Поддерживается только Tesseract 5-й версии.

Является контейнером для таких OCR-элементов, как Клик текста мышью и Распознать текст.

Свойства

Описание общих свойств элемента см. в разделе Свойства элемента.
Символ * в названии свойства указывает на обязательность его заполнения.

Свойство	Тип	Описание
*OCR:*
Язык	String	Язык для извлечения текста из изображения или элемента UI. Указать можно только 1 язык. По умолчанию `"eng"` (коды можно просмотреть здесь ). Папку с языковыми данными нейросети можно скачать .
Масштаб	Double	Коэффициент масштабирования изображения. Рекомендуется использовать для небольших изображений. Значение `1.00` соответствует оригинальному размеру. Чем выше число, тем больше масштаб
Путь к данным		Путь к хранилищу данных нейросети, расположенному по ссылке (совместим с версией 5.0)
*Вывод:*
Переменная	LTools.OCR.OCRInst	Переменная для хранения ссылки на ядро OCR

При возникновении ошибки с файлом libdl иногда она может быть решена с помощью выполнения команды:
sudo ln -s /usr/lib/x86_64-linux-gnu/libglu.so.2 /usr/lib/x86_64-linux-gnu/libdl.so
В некоторых случаях для работы Tesseract OCR для Linux может потребоваться установка дополнительных пакетов:
libtesseract-dev
libleptonica-dev
liblept5
После установки пакетов нужно скопировать (и переименовать) файлы:
/usr/lib/libleptonica.so.6.0.0 -> /app/ProjectName/x64/libleptonica-1.82.0.so
/usr/lib/libtesseract.so.5.0.3 -> /app/ProjectName/x64/libtesseract50.so