Настройка полей в редакторе “Настройки распознавания полей”
После загрузки изображения документа и выделения всех нужных зон можно настроить параметры распознавания для каждого поля.
Шаг 1. Выбор поля
В левой части интерфейса находится список всех добавленных полей. Нажмите на нужное, чтобы открыть его настройки.
Шаг 2. Настройка параметров поля
В открывшейся карточке укажите параметры для выбранного поля:
Параметр | Описание |
---|---|
Движок | Определите, какая нейросеть будет использоваться: Tesseract – выполняет вычисления на CPU даже при наличии GPU. Подходит для простых полей без высоких требований к качеству. Можно частично использовать вместе с ViT, чтобы снизить нагрузку на GPU. ViT – обеспечивает более точное распознавание текста при детальном запросе к модели. Требует значительных ресурсов: обработка одного поля на даже самых мощных CPU может занимать десятки секунд. |
Тип | Выберите тип содержимого: String — текстовое поле Numeric — числа (например, номер паспорта) Date — даты Email , QrCode , BarCode , Signature , Picture — специальные типы TableHeader , TableBody , TableFooter — если поле входит в таблицу SquaredStamp , RoundedStamp — штампы |
Язык (только для Tesseract) | Выберите язык документа |
Ориентация (только для Tesseract) | Используется, если текст расположен под углом. Например: 0 — стандартная горизонтальная надпись 90 — вертикальный текст (как в полях номера паспорта) |
Строки (только для Tesseract) | Укажите, сколько строк текста ожидается в поле. Например: 1 — фамилия, имя и т.п. 2+ — для полей, где может быть несколько строк (например, “Кем выдан”). |
Системный промпт (только для ViT) | Глобальная инструкция для модели. Варианты: По-умолчанию — встроенный промпт модели, стандартная логика без дополнительных указаний. Общий — общий шаблон для любых полей. Ручной — собственный текст инструкции, например:“You are a highly accurate program for digitizing images.” Системный промпт задает общую логику работы ViT: как извлекать текст, какие языки предпочитать, как действовать при пустом поле и т.д. |
Запрос к модели | Инструкция для конкретного поля — уточняет, что именно извлекать. Доступны готовые шаблоны: Общий — универсальный режим. Без заголовка — если область разметки не включает заголовок поля. С заголовком — если захватывается заголовок. Можно редактировать и прописывать, например: “Extract all text from the image and output it as plain text only.” |
⚠️
Запрос к модели и системное сообщение целесообразно формулировать на английском языке, т.к. большинство используемых моделей обучались преимущественно на англоязычных текстах, и лучше его интерпретируют.
Что дальше
Следующий шаг — настройка Тестирование .