Общая информация

Проект — это объект AI Server, с помощью которого вы можете управлять моделями различного типа, а также их изолированными ресурсами.

Все доступные проекты отображаются на странице Проекты. Каждый проект представляет собой карточку с верхнеуровневой информацией:

Название проекта.
Тип проекта.
Описание проекта.
Дата создания.

Чтобы перейти в определенный проект, достаточно выбрать его карточку.

Список проектов можно отфильтровать по типу, в том числе отдельно отобразить только проекты с агентскими системами.

Проекты делятся на типы:

Умный OCR — решение для автоматического распознавания, извлечения данных и классификации документов любой сложности с использованием машинного обучения.
AI Текст — инструмент для настройки NLP-задач по генерации и анализу текстов, а также для создания автономных агентских систем.

Общие операции по управлению проектом описаны здесь. К ним относятся: создание, просмотр, редактирование, удаление проекта любого типа.

Тип проекта Умный OCR

Проекты Умного OCR работают с изображениями документов и позволяют:

классифицировать документы по заранее известным типам;
распознавать данные в документах утвержденной формы;
распознавать данные в документах произвольной формы на белом фоне.

Каждый OCR-проект группирует изолированные ресурсы модели — датасеты, схемы разметки, шаблоны обучения и инференса, которые требуются для обучения и оптимизации модели.

Структура OCR-проекта содержит специальные страницы для управления перечисленными ресурсами:

Инструкции

Встроенные OCR-проекты — инструкции описывают процесс работы с OCR-проектами из поставки. Все встроенные проекты уже содержат обученные модели классификации или распознавания данных, оптимизированные командой AI Server. Пользователю потребуется только подготовить целевую машину к инференсу.
Работа с типом проекта Умный OCR — описывает создание проекта с нуля, в котором пользователь должен самостоятельно обучить модель на подготовленной выборке данных, после чего перейти к настройке инференса.

Тип проекта AI Текст

Проект AI Текст используется для решения NLP-задач с помощью больших языковых моделей (LLM).

Поддерживаемые навыки:

Экстракция — извлечение данных из текста
Классификация — распределение текста по категориям
Генерация — создание текста по заданным параметрам
Суммаризация — краткое содержание текста
OCR — распознавание текста на изображениях (для мультимодальных моделей)

Навыки настраиваются в проекте и выполняются на целевой машине с развернутой LLM. Их можно переиспользовать для разных моделей и сценариев.

Проект также поддерживает создание агентских систем для автоматизации сложных многошаговых сценариев обработки текста и взаимодействия с данными.

Он позволяет обрабатывать неструктурированный текст и строить гибкие NLP-процессы под задачи бизнеса.