Tesseract OCR
Элемент осуществляет подключение к ядру OCR Tesseract. Поддерживается только Tesseract 5-й версии.
Является контейнером для таких OCR-элементов, как Клик текста мышью и Распознать текст.
Свойства
Описание общих свойств элемента см. в разделе Свойства элемента.
Символ *
в названии свойства указывает на обязательность его заполнения.
Свойство | Тип | Описание |
---|---|---|
OCR: | ||
Язык | String | Язык для извлечения текста из изображения или элемента UI. Указать можно только 1 язык. По умолчанию "eng" (коды можно просмотреть здесь ). Папку с языковыми данными нейросети можно скачать . |
Масштаб | Double | Коэффициент масштабирования изображения. Рекомендуется использовать для небольших изображений. Значение 1.00 соответствует оригинальному размеру. Чем выше число, тем больше масштаб |
Путь к данным | Путь к хранилищу данных нейросети, расположенному по ссылке (совместим с версией 5.0) | |
Вывод: | ||
Переменная | LTools.OCR.OCRInst | Переменная для хранения ссылки на ядро OCR |
Решение проблем
- При возникновении ошибки с файлом
libdl
иногда она может быть решена с помощью выполнения команды:
sudo ln -s /usr/lib/x86_64-linux-gnu/libglu.so.2 /usr/lib/x86_64-linux-gnu/libdl.so
- В некоторых случаях для работы Tesseract OCR для Linux может потребоваться установка дополнительных пакетов:
libtesseract-dev
libleptonica-dev
liblept5
После установки пакетов нужно скопировать (и переименовать) файлы:
/usr/lib/libleptonica.so.6.0.0
->/app/ProjectName/x64/libleptonica-1.82.0.so
/usr/lib/libtesseract.so.5.0.3
->/app/ProjectName/x64/libtesseract50.so