Встроенные OCR-проекты
AI Server поставляется с набором обученных моделей и встроенных проектов, в которых они используются. Встроенные проекты отображаются на главной странице сразу после входа в систему.

Типы встроенных OCR-проектов
Встроенные OCR-проекты можно разделить на следующие группы:
Проекты по распознаванию документов утвержденной формы
- Паспорт — проект с моделью, обученной распознавать данные в изображениях паспортов.
- СНИЛС — проект с моделью, обученной распознавать данные в изображениях СНИЛС.
- Торг-12 — проект с моделью, обученной распознавать данные в изображениях накладных ТОРГ-12.
- УПД — проект с моделью, обученной распознавать данные в изображениях универсальных передаточных документов (УПД).
Проекты для классификации документов по типам
- Классификатор — проект с предобученной моделью для автоматической классификации документов по типам. Проект позволяет определить тип документа для дальнейшей обработки соответствующей моделью распознавания.
В текущую поставку входят некоторые востребованные классы документов. Список поддерживаемых классов будет расширяться в новых версиях продукта.
Если требуется классификация документов по другим типам, отсутствующим во встроенном проекте, рекомендуется создать и обучить собственный классификатор (или классификаторы) под задачи организации.
Классификатор работает с моделями компьютерного зрения и не использует OCR. Для классификации неотличимых по визуальной форме документов по тонким текстовым признакам используйте Семантический классификатор (в разработке).
Классификатор позволяет найти несколько документов на одном изображении (странице PDF).
Проекты по распознаванию документов произвольной формы
- Неструктурированный документ — проект с моделью, обученной извлекать данные из документов произвольной структуры на белом фоне. Под данными подразумеваются абзацы, таблицы, заголовки, печати и другие элементы документа.
Файлы моделей входят в комплект поставки Primo RPA AI Server. Список встроенных моделей и проектов постоянно расширяется.
Возможные сценарии автоматизации
Встроенные проекты позволяют быстро протестировать возможности AI Server и использовать готовые модели в типовых процессах обработки документов.
Сценарий 1. Автоматическая маршрутизация документов
- Передайте смешанный набор документов в проект Классификатор.
- После определения типа документа направьте его в соответствующий проект распознавания, например, Паспорт, СНИЛС, Торг-12 или УПД.
- Используйте извлеченные данные в бизнес-процессах, RPA-сценариях или внешних информационных системах.
Сценарий 2. Обработка документов произвольной структуры
- Передайте договор, акт, письмо или другой документ произвольной формы в проект Неструктурированный документ.
- Извлеките текст, таблицы, заголовки, печати и другие элементы документа.
- Передайте полученные данные в большие языковые модели компонента AI Текст для анализа, поиска информации, классификации или подготовки ответов.
Сценарий 3. Создание собственного решения
- Используйте встроенные проекты как отправную точку для знакомства с возможностями AI Server.
- Если требуется распознавать или классифицировать документы, отсутствующие среди встроенных проектов, создайте собственный проект и обучите модель на своих данных.
- Интегрируйте обученную модель в существующие бизнес-процессы организации.
Таким образом, встроенные проекты позволяют быстро начать работу с AI Server, протестировать функции сервиса и использовать готовые модели для решения типовых задач по обработке документов.