Skip to Content
РелизыAI ServerAI Server 1.24.12

AI Server 1.24.12

История изменений в версии 1.24.12, выпущенной в декабре 2024-го года.

Информацию по обновленным релизам версии 1.24.12 можно найти в разделах:

Компонент AI текст

Для обработки информации на естественном языке появился компонент с большими языковыми моделями (LLM). Модели анализируют указанный произвольный текст и используют его при генерации ответов. Работать с моделями возможно в закрытом контуре для защиты чувствительных данных.

Что умеют LLM-модели:

  • Извлекать из текста информацию — помогут найти номер договора, дату и другие данные.
  • Классифицировать текст — рассортируют письма из общего ящика организации.
  • Суммировать информацию из текста — расскажут самое важное из длинного текста.
  • Создавать текст — напишут вакансию под указанные параметры.

Перечисленные возможности моделей получили название навыки. Модель может обладать одним или сразу несколькими навыками для решения корпоративных задач.

Особенности работы компонента:

  • LLM-модели не требуют обучения.
  • Работа с моделями осуществляется в проекте с типом NLP-задачи (Natural Language Processing) — задачи по обработке естественного языка.
  • Конфигурация и запуск модели выполняются на одной странице проекта — минимизировано количество шагов для использования модели.
  • Существует возможность протестировать модель до начала эксплуатации — сервис предоставляет UI-инструмент для отправки тестовых запросов и отладки поведения модели.
  • Поведение модели можно улучшить с помощью файла контекста, где прописываются примеры ответов на однотипные запросы.
  • Для отправки запросов роботами доступны следующие элементы в пакете Primo.AI.Server:
    • Создать запрос NLP — отправляет запрос к Server AI для обработки текста на естественном языке и сохраняет идентификатор запроса.
    • Получить результат NLP — получает результат обработки текста по идентификатору запроса.
  • Роботы могут гибко изменять поведение модели для каждого запроса с помощью специальных свойств элементов.
  • Для отправки запросов из внешних систем доступен API, спецификация которого описана по стандарту Open API.

Компонент Умный OCR

  1. Добавили обученную модель Any Text, которая умеет распознавать текст в сканах документов произвольной формы. Модель подходит для распознавания актов, договоров и любых других неструктурированных документов на белом фоне.

    Протестировать возможности модели вы можете в рамках встроенного проекта Неструктурированный документ. Результат распознавания — текст документа — в дальнейшем можно использовать в компоненте AI Текст.

  2. Появился инструмент автоматической разметки данных — теперь стало проще и быстрее размечать данные в сканах документов. Для этого подготовьте несколько примеров корректно размеченных изображений и обучите на их основе модель, которая сможет самостоятельно разметить оставшиеся сканы документов. Функция доступна на панели инструментов в разделе Разметка данных — инструмент становится активным, как только вы разметите несколько изображений. При выборе инструмента осуществится переход на страницу создания шаблонов автоматической разметки.

  3. В проектах типа Умный OCR появилась страница Тестирование — загружайте тестовые сканы документов, чтобы оценить качество распознавания или классификации обученной модели. Функция позволяет протестировать различные сценарии использования и выявить возможные проблемы до начала использования модели на реальных данных.