Tesseract OCR

Элемент осуществляет подключение к ядру OCR Tesseract. Поддерживается только Tesseract 5-й версии.
Является контейнером для таких OCR-элементов, как Клик текста мышью и Распознать текст.
Свойства
Описание общих свойств элемента см. в разделе Свойства элемента.
Символ * в названии свойства указывает на обязательность его заполнения.
| Свойство | Тип | Описание |
|---|---|---|
| OCR: | ||
| Язык | String | Язык для извлечения текста из изображения или элемента UI. Указать можно только 1 язык. По умолчанию "eng" (коды можно просмотреть здесь ). Папку с языковыми данными нейросети можно скачать . |
| Масштаб | Double | Коэффициент масштабирования изображения. Рекомендуется использовать для небольших изображений. Значение 1.00 соответствует оригинальному размеру. Чем выше число, тем больше масштаб |
| Путь к данным | Путь к хранилищу данных нейросети, расположенному по ссылке (совместим с версией 5.0) | |
| Вывод: | ||
| Переменная | LTools.OCR.OCRInst | Переменная для хранения ссылки на ядро OCR |
Решение проблем
- При возникновении ошибки с файлом
libdlиногда она может быть решена с помощью выполнения команды:
sudo ln -s /usr/lib/x86_64-linux-gnu/libglu.so.2 /usr/lib/x86_64-linux-gnu/libdl.so - В некоторых случаях для работы Tesseract OCR для Linux может потребоваться установка дополнительных пакетов:
libtesseract-dev
libleptonica-dev
liblept5
После установки пакетов нужно скопировать (и переименовать) файлы:
/usr/lib/libleptonica.so.6.0.0->/app/ProjectName/x64/libleptonica-1.82.0.so
/usr/lib/libtesseract.so.5.0.3->/app/ProjectName/x64/libtesseract50.so