Настройка полей в редакторе “Настройки распознавания полей”

После загрузки изображения документа и выделения всех нужных зон можно настроить параметры распознавания для каждого поля.

alt

Шаг 1. Выбор поля

В левой части интерфейса находится список всех добавленных полей. Нажмите на нужное, чтобы открыть его настройки.

Шаг 2. Настройка параметров поля

В открывшейся карточке укажите параметры для выбранного поля:

Параметр	Описание
Движок	Определите, какая нейросеть будет использоваться: • Tesseract — выполняет вычисления на CPU даже при наличии GPU. Подходит для простых полей без высоких требований к качеству. Можно частично использовать вместе с ViT, чтобы снизить нагрузку на GPU. • ViT — обеспечивает более точное распознавание текста при детальном запросе к модели. Требует значительных ресурсов: обработка одного поля даже на мощных CPU может занимать десятки секунд.
Тип	Выберите тип содержимого: `• String` — используется для извлечения текстовых значений: имена, адреса, названия организаций, подписи в виде текста и т.д. `• Numeric` — подходит для числовых данных, например номера паспорта, коды подразделений, регистрационные номера. `• Date` — применяется для распознавания дат в различных форматах. `• Email`— извлекает адреса электронной почты. `• QrCode`— распознаёт и декодирует QR-коды, возвращая их содержимое. `• BarCode`— используется для извлечения штрих-кодов и их цифрового значения. `• Signature`— область, содержащая рукописную подпись. `• Picture` — применяется для извлечения изображений. `• TableHeader`, `TableBody`, `TableFooter` — указывают принадлежность поля к определённой части таблицы, используются при извлечении данных из табличных структур. `• SquaredStamp`— прямоугольный или квадратный штамп, часто содержит название организации и дату. `• RoundedStamp` — круглая печать, обычно содержит логотип и регистрационные данные организации.
Язык (только для Tesseract)	Выберите язык документа.
Ориентация (только для Tesseract)	Используется, если текст расположен под углом. Например: `• 0` — стандартная горизонтальная надпись `• 90` — вертикальный текст (как в полях номера паспорта)
Строки (только для Tesseract)	Укажите, сколько строк текста ожидается в поле. Например: `• 1` — фамилия, имя и т.п. `• 2+` — для полей, где может быть несколько строк (например, «Кем выдан»)
Системный промпт (только для ViT)	Глобальная инструкция для модели. Варианты: • По-умолчанию — встроенный промпт модели, стандартная логика без дополнительных указаний. • Общий — общий шаблон для любых полей. • Ручной — собственный текст инструкции, например: “You are a highly accurate program for digitizing images.” Системный промпт задает общую логику работы ViT: как извлекать текст, какие языки предпочитать, как действовать при пустом поле и т.д.
Запрос к модели	Инструкция для конкретного поля: уточняет, что именно извлекать. Доступны готовые шаблоны: • Общий — универсальный режим. • Без заголовка — если область разметки не включает заголовок поля. • С заголовком — если захватывается заголовок. Можно редактировать и прописывать, например: “Extract all text from the image and output it as plain text only.” ⚠️ Запрос к модели и системное сообщение целесообразно формулировать на английском языке, т.к. большинство используемых моделей обучались преимущественно на англоязычных текстах, и лучше его интерпретируют.

Шаг 3. Сохранение результата

После того как вы настроили поля и параметры, сохранение происходит автоматически. Никаких дополнительных действий выполнять не нужно.

Чтобы вернуться к работе над проектом, нажмите кнопку Вернуться в проект в левом верхнем углу экрана.

Что дальше

Следующий шаг — настройка Тестирование .