Skip to Content
Primo RPA AI ServerПользователямРабота с типом проекта Умный OCRИспользованиеНастройка полей в редакторе «Настройки распознавания полей»

Настройка полей в редакторе “Настройки распознавания полей”

После загрузки изображения документа и выделения всех нужных зон можно настроить параметры распознавания для каждого поля.

alt

Шаг 1. Выбор поля

В левой части интерфейса находится список всех добавленных полей. Нажмите на нужное, чтобы открыть его настройки.

Шаг 2. Настройка параметров поля

В открывшейся карточке укажите параметры для выбранного поля:

ПараметрОписание
ДвижокОпределите, какая нейросеть будет использоваться: Tesseract – выполняет вычисления на CPU даже при наличии GPU. Подходит для простых полей без высоких требований к качеству. Можно частично использовать вместе с ViT, чтобы снизить нагрузку на GPU. ViT – обеспечивает более точное распознавание текста при детальном запросе к модели. Требует значительных ресурсов: обработка одного поля на даже самых мощных CPU может занимать десятки секунд.
ТипВыберите тип содержимого: String — текстовое поле Numeric — числа (например, номер паспорта) Date — даты Email, QrCode, BarCode, Signature, Picture — специальные типы TableHeader, TableBody, TableFooter — если поле входит в таблицу SquaredStamp, RoundedStamp — штампы
Язык (только для Tesseract)Выберите язык документа
Ориентация (только для Tesseract)Используется, если текст расположен под углом. Например: 0 — стандартная горизонтальная надпись 90 — вертикальный текст (как в полях номера паспорта)
Строки (только для Tesseract)Укажите, сколько строк текста ожидается в поле. Например: 1 — фамилия, имя и т.п. 2+ — для полей, где может быть несколько строк (например, “Кем выдан”).
Системный промпт (только для ViT)Глобальная инструкция для модели. Варианты: По-умолчанию — встроенный промпт модели, стандартная логика без дополнительных указаний. Общий — общий шаблон для любых полей. Ручной — собственный текст инструкции, например: “You are a highly accurate program for digitizing images.” Системный промпт задает общую логику работы ViT: как извлекать текст, какие языки предпочитать, как действовать при пустом поле и т.д.
Запрос к моделиИнструкция для конкретного поля — уточняет, что именно извлекать. Доступны готовые шаблоны: Общий — универсальный режим. Без заголовка — если область разметки не включает заголовок поля. С заголовком — если захватывается заголовок. Можно редактировать и прописывать, например: “Extract all text from the image and output it as plain text only.”
⚠️

Запрос к модели и системное сообщение целесообразно формулировать на английском языке, т.к. большинство используемых моделей обучались преимущественно на англоязычных текстах, и лучше его интерпретируют.

Что дальше

Следующий шаг — настройка Тестирование.