Общая информация
Проект — это объект AI Server, с помощью которого вы можете управлять моделями различного типа, а также их изолированными ресурсами.
Все доступные проекты отображаются на странице Проекты. Каждый проект представляет собой карточку с верхнеуровневой информацией:
- Название проекта.
- Описание проекта.
- MAX — максимальное число единовременных запросов. В настоящей версии не используется.
- MDN — медианное число запросов. В настоящей версии не используется.
Чтобы перейти в определенный проект, достаточно выбрать его карточку.
Проекты делятся на типы:
- Умный OCR — используется для обработки изображений документов с помощью заранее обученных моделей.
- NLP-задачи — используется для обработки данных с помощью больших языковых моделей. В качестве данных может выступать текст на естественном языке или изображение документа, на котором требуется распознать текст.
Общие операции по управлению проектом описаны здесь. К ним относятся: создание, просмотр, редактирование, удаление проекта любого типа.
Тип проекта Умный OCR
Проекты Умного OCR работают с изображениями документов и позволяют:
- классифицировать документы по заранее известным типам;
- распознавать данные в документах утвержденной формы;
- распознавать данные в документах произвольной формы на белом фоне.
Каждый OCR-проект группирует изолированные ресурсы модели — датасеты, схемы разметки, шаблоны обучения и инференса, которые требуются для обучения и оптимизации модели.
Структура OCR-проекта содержит специальные страницы для управления перечисленными ресурсами. Чтобы их увидеть, перейдите в проект — меню отобразится в боковой панели:
Инструкции
- Встроенные OCR-проекты — инструкции описывают процесс работы с OCR-проектами из поставки. Все встроенные проекты уже содержат обученные модели классификации или распознавания данных, оптимизированные командой AI Server. Пользователю потребуется только подготовить целевую машину к инференсу.
- Работа с типом проекта Умный OCR — описывает создание проекта с нуля, в котором пользователь должен самостоятельно обучить модель на подготовленной выборке данных, после чего перейти к настройке инференса.
Тип проекта NLP-задачи
Проект используется для решения задач NLP (Natural Language Processing) — обработки текста на естественном языке. Обработкой занимаются большие языковые модели (LLM), которым пользователь должен назначить один или несколько навыков:
- Экстракция — модель извлекает из текста информацию по заданным ключам поиска.
- Классификация — модель классифицирует текст по классам, которые указал пользователь.
- Генерация — модель создает текст по заданным параметрам.
- Суммаризация — модель кратко излагает текст с акцентом на определенные темы.
- OCR — модель распознает текст на входном изображении. С этим навыком умеют работать только мультимодальные модели.
Навыки выбираются при настройке проекта и зависят от задач, которые вы хотите решить. Обслуживанием навыков занимается выбранная в проекте целевая машина, на которой предварительно была развернута и запущена большая языковая модель. Навыки возможно переиспользовать на разных целевых машинах, чтобы определить, какая модель наиболее эффективно справляется с поставленными задачами.
Инструкции
- Управление моделями на целевой машине — описывает, как сконфигурировать целевую машину и запустить на ней большую языковую модель.
- Выбор модели и настройка ее навыков — описывает, как назначить модели набор навыков и выбрать целевую машину, которая будет их обслуживать.
- Тестирование навыков модели — описывает, как протестировать навыки сконфигурированной модели.