Общая информация
Проект — объект сервиса AI Server, с помощью которого вы можете управлять моделями различного типа и изолированными ресурсами.
Все доступные проекты отображаются на главной странице Проекты. Каждый проект представляет собой карточку с верхнеуровневой информацией:
- Название проекта.
- Описание проекта.
- MAX — максимальное число единовременных запросов. В настоящей версии не используется.
- MDN — медианное число запросов. В настоящей версии не используется.
Чтобы перейти в определенный проект, достаточно выбрать его карточку.
Проекты делятся на несколько типов:
- Умный OCR — используется для обработки изображений документов с помощью сверточных моделей.
- NLP-задачи — используется для обработки данных с помощью больших языковых моделей. В качестве данных может выступать текст на естественном языке или изображение, на котором требуется распознать такой текст.
Действия по управлению проектом любого типа описаны здесь. К ним относятся возможности создания, просмотра, редактирования, удаления проекта.
Тип проекта Умный OCR
Проекты Умного OCR работают с изображениями документов и позволяют:
- классифицировать документы по заранее известным типам;
- распознавать данные в документах утвержденной формы;
- распознавать данные в документах произвольной формы.
Каждый проект группирует такие изолированные ресурсы, как датасеты, схемы разметки, шаблоны обучения и инференса, которые требуются для обучения и оптимизации модели.
Структура проекта содержит страницы для управления перечисленными ресурсами. Чтобы увидеть меню управления ресурсами, перейдите в проект — меню отобразится в панели слева:
Инструкции
- Встроенные OCR-проекты — описывает процесс работы со встроенным проектом, который содержит обученную модель классификации или распознавания данных.
- Работа с типом проекта Умный OCR — описывает создание проекта с нуля, в котором потребуется обучить модель самостоятельно.
Тип проекта NLP-задачи
Проект используется для решения задач NLP (Natural Language Processing) — обработки текста на естественном языке. Для обработки входного текста используются большие языковые модели, которым назначаются один или несколько навыков:
- Экстракция — модель извлекает из текста информацию по заданным ключам поиска.
- Классификация — модель классифицирует текст по указанным классам.
- Генерация — модель создает текст по заданным параметрам.
- Суммаризация — модель кратко излагает текст с акцентом на определенные темы.
Навык выбирается в зависимости от той задачи, которую вы хотите решить с помощью модели.
Инструкции
- Выбор модели и настройка ее навыков — описывает, как назначить модели набор навыков и выбрать целевую машину, которая будет их обслуживать
- Тестирование навыков модели — описывает, как протестировать навыки сконфигурированной модели.