AI Server 1.24.12

История изменений в Primo RPA AI Server за декабрь 2024-го года.

Компонент AI текст

Для обработки информации на естественном языке появился компонент с большими языковыми моделями (LLM). Модели анализируют указанный произвольный текст и используют его при генерации ответов. Работать с моделями возможно в закрытом контуре для защиты чувствительных данных.

Что умеют LLM-модели:

  • Извлекать из текста информацию — помогут найти номер договора, дату и другие данные.

  • Классифицировать текст — рассортируют письма из общего ящика организации.

  • Суммировать информацию из текста — расскажут самое важное из длинного текста.

  • Создавать текст — напишут вакансию под указанные параметры.

Перечисленные возможности моделей получили название навыки. Модель может обладать одним или сразу несколькими навыками для решения корпоративных задач.

Особенности работы компонента:

  • LLM-модели не требуют обучения.

  • Работа с моделями осуществляется в проекте с типом NLP-задачи (Natural Language Processing) — задачи по обработке естественного языка.

  • Конфигурация и запуск модели выполняются на одной странице проекта — минимизировано количество шагов для использования модели.

  • Существует возможность протестировать модель до начала эксплуатации — сервис предоставляет UI-инструмент для отправки тестовых запросов и отладки поведения модели.

  • Поведение модели можно улучшить с помощью файла контекста, где прописываются примеры ответов на однотипные запросы.

  • Для отправки запросов роботами доступны следующие элементы в пакете Primo.AI.Server:

    • Создать запрос NLP — отправляет запрос к Server AI для обработки текста на естественном языке и сохраняет идентификатор запроса.

    • Получить результат NLP — получает результат обработки текста по идентификатору запроса.

  • Роботы могут гибко изменять поведение модели для каждого запроса с помощью специальных свойств элементов.

  • Для отправки запросов из внешних систем доступен API, спецификация которого описана по стандарту Open API.

Компонент Умный OCR

  1. Добавили обученную модель Any Text, которая умеет распознавать текст в сканах документов произвольной формы. Модель подходит для распознавания актов, договоров и любых других неструктурированных документов на белом фоне.

    Протестировать возможности модели вы можете в рамках встроенного проекта Неструктурированный документ. Результат распознавания — текст документа — в дальнейшем можно использовать в компоненте AI Текст.

  2. Появился инструмент автоматической разметки данных — теперь стало проще и быстрее размечать данные в сканах документов. Для этого подготовьте несколько примеров корректно размеченных изображений и обучите на их основе модель, которая сможет самостоятельно разметить оставшиеся сканы документов. Функция доступна на панели инструментов в разделе Разметка данных — инструмент становится активным, как только вы разметите несколько изображений. При выборе инструмента осуществится переход на страницу создания шаблонов автоматической разметки.

  3. В проектах типа Умный OCR появилась страница Тестирование — загружайте тестовые сканы документов, чтобы оценить качество распознавания или классификации обученной модели. Функция позволяет протестировать различные сценарии использования и выявить возможные проблемы до начала использования модели на реальных данных.

Last updated