Skip to Content

Найти текст в области

alt

(Доступно с версии Primo.AI.Server 1.0.13)

Элемент выполняет поиск текстовых данных в заданных ячейках виртуальной сетки, наложенной на изображение документа. Основные сценарии использования:

  • Извлечение данных из табличных структур
  • Поиск информации в формализованных бланках
  • Обработка документов с четкой структурой расположения данных

Перед началом работы

Установите в Студии библиотеку Primo.AI.Server.

Свойства

Символ * указывает на обязательность заполнения свойства. Описание общих свойств см. в разделе Свойства элемента.

Основные параметры

СвойствоТипОписаниеОбязательность
Результат распознаванияPrimo.AI.Server.Model.InferenceResultContentРезультаты работы OCR-движка с координатами распознанных элементов
Ширина изображенияint?Физическая ширина изображения в пикселях
Высота изображенияint?Физическая высота изображения в пикселях
ИзображениеStringПуть к файлу изображения (поддерживаемые форматы: JPG, JPEG, PNG)
Количество строкintКоличество горизонтальных линий сетки (делят высоту). По умолчанию установлено значение 2.
Количество колонокintКоличество вертикальных линий сетки (делят ширину). По умолчанию установлено значение 2.
Ячейки для поискаList<Tuple<int, int>>Список целевых ячеек в формате (строка, колонка), индексация с 1

Свойства выходных данных

Тип: Primo.AI.Server.Tools.SmartOcr.TextInAreaSearcherResult

СвойствоТипОписание
IsFoundBooleanФлаг успешности поиска (true - если найдены совпадения)
ItemsIReadOnlyCollection<TextInArea>Коллекция найденных текстовых элементов

Структура TextInArea

СвойствоТипОписание
IsFoundBooleanФлаг наличия текста в области
UnifiedTextStringОбъединенный текст всех найденных элементов
ItemsIReadOnlyCollection<InferenceResultItem>Детализированные результаты распознавания
CropAreaRectangleГеометрия области поиска (координаты)

Принцип работы

  1. Построение сетки:

    • Изображение делится на виртуальные ячейки согласно указанным:
      • Количество строк (по вертикали, по умолчанию: 2)
      • Количество колонок (по горизонтали, по умолчанию: 2)
    • Размеры ячеек рассчитываются автоматически:
      • Ширина = (ширина изображения) / (кол-во колонок)
      • Высота = (высота изображения) / (кол-во строк)
  2. Определение целевых областей:

    • Для каждой ячейки из Ячейки для поиска вычисляются фактические координаты
    • Пример: для ячейки (2,3) в сетке 4x3 будут рассчитаны точные границы
    • По умолчанию (если ячейки не указаны) поиск выполняется во всех ячейках
  3. Поиск текстовых элементов:

    • Анализируются все элементы распознавания
    • Отбираются только те, которые полностью попадают в целевую область
  4. Формирование результата:

    • Найденные элементы упорядочиваются (слева-направо, сверху-вниз)
    • Тексты объединяются в свойство UnifiedText.