Шаблоны процесса инференс: Дополнительные параметры
Дополнительные настройки доступны через выпадающее меню на последнем этапе конфигурации шаблона инференса:
Описание параметров приведено в таблице ниже:
Параметр | Описание | Влияние | Пример | Значение по умолчанию |
---|---|---|---|---|
BboxMode | Формат задания координат для инструмента Bounding boxes (bbox) | Итоговый формат координат в результатах | {minX": 624,"minY": 784,"maxX": 712,"maxY": 803} | Не задано (0 — XYXY_ABS ) |
KeepAliveInterval | Частота отправки процессом телеметрии (в секундах) | Запаздывание при обнаружении процесса неактивным | 30 (если требуется уменьшить задержку) | 60 |
MinLineHeight | Минимальная высота строки | Насколько мелкой (в пикселях) должна быть строка, чтобы восприниматься как строка | 6 (при наличии мелкого шрифта) | 8 |
OptimalHeight | Оптимальная высота символов для OCR | Адаптация к масштабу текста | 45 (для высокого разрешения) | 35 |
BlackLineThreshold | Порог распознавания тёмных линий | Порог яркости при определении тёмных линий | 95 (если изображение светлое и контрастное) | 75 |
WhiteThreshold | Порог определения светлого фона | Порог яркости при определении фона Параметр игнорируется | 235 (для светлого документа) | 215 |
WhiteBackground | Есть ли светлый фон | Если выключено, происходит нормализация документа | Для первичной бухгалтерской документации: Включен Для паспорта РФ: Выключен | Выключен |
Padding | Обрамление по периметру bounding boxes (bbox) | Улучшает распознавание, когда текст касается границ bbox | — | 15 |
Confidence | Минимальный уровень уверенности OCR | Фильтрует сомнительные предсказания | 0.1 (для разнообразного датасета) | 0.45 |
Multiprocessing | Количество параллельных процессов | Дополнительное ограничение нагрузки По умолчанию ограничено по формуле 0.5n - 1 , где n — количество ядер ЦПУ.Если указать значение выше, оно будет проигнорировано. | 1 (отключает параллельность) | Не задано |
SmallTextFilter | Порог фильтрации текста (в % от минимальной строки) | Исключение мелкого текста (примечания, сноски), шума | 0.2 | 0.55 |
MinWordHeight | Минимальная высота символов | Игнорирует слишком мелкие буквы | 6 | 8 |