Общая информация
Проект — это объект AI Server, с помощью которого вы можете управлять моделями различного типа, а также их изолированными ресурсами.
Все доступные проекты отображаются на странице Проекты. Каждый проект представляет собой карточку с верхнеуровневой информацией:
- Название проекта.
- Тип проекта.
- Описание проекта.
- Дата создания.
Чтобы перейти в определенный проект, достаточно выбрать его карточку.

Проекты делятся на типы:
- Умный OCR — решение для автоматического распознавания, извлечения данных и классификации документов любой сложности с использованием машинного обучения.
- AI Текст — инструмент для настройки NLP-задач по генерации и анализу текстов, а также для создания автономных агентских систем.
Общие операции по управлению проектом описаны здесь. К ним относятся: создание, просмотр, редактирование, удаление проекта любого типа.
Тип проекта Умный OCR
Проекты Умного OCR работают с изображениями документов и позволяют:
- классифицировать документы по заранее известным типам;
- распознавать данные в документах утвержденной формы;
- распознавать данные в документах произвольной формы на белом фоне.
Каждый OCR-проект группирует изолированные ресурсы модели — датасеты, схемы разметки, шаблоны обучения и инференса, которые требуются для обучения и оптимизации модели.
Структура OCR-проекта содержит специальные страницы для управления перечисленными ресурсами:

Инструкции
- Встроенные OCR-проекты — инструкции описывают процесс работы с OCR-проектами из поставки. Все встроенные проекты уже содержат обученные модели классификации или распознавания данных, оптимизированные командой AI Server. Пользователю потребуется только подготовить целевую машину к инференсу.
- Работа с типом проекта Умный OCR — описывает создание проекта с нуля, в котором пользователь должен самостоятельно обучить модель на подготовленной выборке данных, после чего перейти к настройке инференса.
Тип проекта AI Текст
Проект AI Текст используется для решения NLP-задач с помощью больших языковых моделей (LLM).
Поддерживаемые навыки:
- Экстракция — извлечение данных из текста
- Классификация — распределение текста по категориям
- Генерация — создание текста по заданным параметрам
- Суммаризация — краткое содержание текста
- OCR — распознавание текста на изображениях (для мультимодальных моделей)
Навыки настраиваются в проекте и выполняются на целевой машине с развернутой LLM. Их можно переиспользовать для разных моделей и сценариев.
Проект также поддерживает создание агентских систем для автоматизации сложных многошаговых сценариев обработки текста и взаимодействия с данными.
Он позволяет обрабатывать неструктурированный текст и строить гибкие NLP-процессы под задачи бизнеса.