Skip to Content

Общая информация

Проект — это объект AI Server, с помощью которого вы можете управлять моделями различного типа, а также их изолированными ресурсами.

Все доступные проекты отображаются на странице Проекты. Каждый проект представляет собой карточку с верхнеуровневой информацией:

  • Название проекта.
  • Описание проекта.
  • MAX — максимальное число единовременных запросов. В настоящей версии не используется.
  • MDN — медианное число запросов. В настоящей версии не используется.

Чтобы перейти в определенный проект, достаточно выбрать его карточку.

alt

Проекты делятся на типы:

  • Умный OCR — используется для обработки изображений документов с помощью заранее обученных моделей.
  • NLP-задачи — используется для обработки данных с помощью больших языковых моделей. В качестве данных может выступать текст на естественном языке или изображение документа, на котором требуется распознать текст.

Общие операции по управлению проектом описаны здесь. К ним относятся: создание, просмотр, редактирование, удаление проекта любого типа.

Тип проекта Умный OCR

Проекты Умного OCR работают с изображениями документов и позволяют:

  • классифицировать документы по заранее известным типам;
  • распознавать данные в документах утвержденной формы;
  • распознавать данные в документах произвольной формы на белом фоне.

Каждый OCR-проект группирует изолированные ресурсы модели — датасеты, схемы разметки, шаблоны обучения и инференса, которые требуются для обучения и оптимизации модели.

Структура OCR-проекта содержит специальные страницы для управления перечисленными ресурсами. Чтобы их увидеть, перейдите в проект — меню отобразится в боковой панели:

alt

Инструкции

  • Встроенные OCR-проекты — инструкции описывают процесс работы с OCR-проектами из поставки. Все встроенные проекты уже содержат обученные модели классификации или распознавания данных, оптимизированные командой AI Server. Пользователю потребуется только подготовить целевую машину к инференсу.
  • Работа с типом проекта Умный OCR — описывает создание проекта с нуля, в котором пользователь должен самостоятельно обучить модель на подготовленной выборке данных, после чего перейти к настройке инференса.

Тип проекта NLP-задачи

Проект используется для решения задач NLP (Natural Language Processing) — обработки текста на естественном языке. Обработкой занимаются большие языковые модели (LLM), которым пользователь должен назначить один или несколько навыков:

  • Экстракция — модель извлекает из текста информацию по заданным ключам поиска.
  • Классификация — модель классифицирует текст по классам, которые указал пользователь.
  • Генерация — модель создает текст по заданным параметрам.
  • Суммаризация — модель кратко излагает текст с акцентом на определенные темы.
  • OCR — модель распознает текст на входном изображении. С этим навыком умеют работать только мультимодальные модели.

Навыки выбираются при настройке проекта и зависят от задач, которые вы хотите решить. Обслуживанием навыков занимается выбранная в проекте целевая машина, на которой предварительно была развернута и запущена большая языковая модель. Навыки возможно переиспользовать на разных целевых машинах, чтобы определить, какая модель наиболее эффективно справляется с поставленными задачами.

Инструкции