Skip to Content
Primo RPA AI ServerПользователямРабота с типом проекта Умный OCRИспользованиеНастройка полей в редакторе «Настройки распознавания полей»

Настройка полей в редакторе “Настройки распознавания полей”

После загрузки изображения документа и выделения всех нужных зон можно настроить параметры распознавания для каждого поля.

alt

Шаг 1. Выбор поля

В левой части интерфейса находится список всех добавленных полей. Нажмите на нужное, чтобы открыть его настройки.

Шаг 2. Настройка параметров поля

В открывшейся карточке укажите параметры для выбранного поля:

ПараметрОписание
ДвижокОпределите, какая нейросеть будет использоваться:
  • • Tesseract — выполняет вычисления на CPU даже при наличии GPU. Подходит для простых полей без высоких требований к качеству. Можно частично использовать вместе с ViT, чтобы снизить нагрузку на GPU.
  • • ViT — обеспечивает более точное распознавание текста при детальном запросе к модели. Требует значительных ресурсов: обработка одного поля даже на мощных CPU может занимать десятки секунд.

ТипВыберите тип содержимого:
  • • String — используется для извлечения текстовых значений: имена, адреса, названия организаций, подписи в виде текста и т.д.
  • • Numeric — подходит для числовых данных, например номера паспорта, коды подразделений, регистрационные номера.
  • • Date — применяется для распознавания дат в различных форматах.
  • • Email— извлекает адреса электронной почты.
  • • QrCode— распознаёт и декодирует QR-коды, возвращая их содержимое.
  • • BarCode— используется для извлечения штрих-кодов и их цифрового значения.
  • • Signature— область, содержащая рукописную подпись.
  • • Picture — применяется для извлечения изображений.
  • • TableHeader, TableBody, TableFooter — указывают принадлежность поля к определённой части таблицы, используются при извлечении данных из табличных структур.
  • • SquaredStamp— прямоугольный или квадратный штамп, часто содержит название организации и дату.
  • • RoundedStamp — круглая печать, обычно содержит логотип и регистрационные данные организации.

Язык (только для Tesseract)
  • Выберите язык документа.

Ориентация (только для Tesseract)Используется, если текст расположен под углом. Например:
  • • 0 — стандартная горизонтальная надпись
  • • 90 — вертикальный текст (как в полях номера паспорта)

Строки (только для Tesseract)Укажите, сколько строк текста ожидается в поле. Например:
  • • 1 — фамилия, имя и т.п.
  • • 2+ — для полей, где может быть несколько строк (например, «Кем выдан»)

Системный промпт (только для ViT)Глобальная инструкция для модели. Варианты:
  • • По-умолчанию — встроенный промпт модели, стандартная логика без дополнительных указаний.
  • • Общий — общий шаблон для любых полей.
  • • Ручной — собственный текст инструкции, например: “You are a highly accurate program for digitizing images.”
Системный промпт задает общую логику работы ViT: как извлекать текст, какие языки предпочитать, как действовать при пустом поле и т.д.

Запрос к моделиИнструкция для конкретного поля: уточняет, что именно извлекать. Доступны готовые шаблоны:
  • • Общий — универсальный режим.
  • • Без заголовка — если область разметки не включает заголовок поля.
  • • С заголовком — если захватывается заголовок.
Можно редактировать и прописывать, например: “Extract all text from the image and output it as plain text only.”
⚠️
Запрос к модели и системное сообщение целесообразно формулировать на английском языке, т.к. большинство используемых моделей обучались преимущественно на англоязычных текстах, и лучше его интерпретируют.

Шаг 3. Сохранение результата

После того как вы настроили поля и параметры, сохранение происходит автоматически. Никаких дополнительных действий выполнять не нужно.

Чтобы вернуться к работе над проектом, нажмите кнопку Вернуться в проект в левом верхнем углу экрана.

Что дальше

Следующий шаг — настройка Тестирование.