AI Server 1.24.12
История изменений в Primo RPA AI Server за декабрь 2024-го года.
Компонент AI текст
Для обработки информации на естественном языке появился компонент с большими языковыми моделями (LLM). Модели анализируют указанный произвольный текст и используют его при генерации ответов. Работать с моделями возможно в закрытом контуре для защиты чувствительных данных.
Что умеют LLM-модели:
Извлекать из текста информацию — помогут найти номер договора, дату и другие данные.
Классифицировать текст — рассортируют письма из общего ящика организации.
Суммировать информацию из текста — расскажут самое важное из длинного текста.
Создавать текст — напишут вакансию под указанные параметры.
Перечисленные возможности моделей получили название навыки. Модель может обладать одним или сразу несколькими навыками для решения корпоративных задач.
Особенности работы компонента:
LLM-модели не требуют обучения.
Работа с моделями осуществляется в проекте с типом NLP-задачи (Natural Language Processing) — задачи по обработке естественного языка.
Конфигурация и запуск модели выполняются на одной странице проекта — минимизировано количество шагов для использования модели.
Существует возможность протестировать модель до начала эксплуатации — сервис предоставляет UI-инструмент для отправки тестовых запросов и отладки поведения модели.
Поведение модели можно улучшить с помощью файла контекста, где прописываются примеры ответов на однотипные запросы.
Для отправки запросов роботами доступны следующие элементы в пакете Primo.AI.Server:
Создать запрос NLP — отправляет запрос к Server AI для обработки текста на естественном языке и сохраняет идентификатор запроса.
Получить результат NLP — получает результат обработки текста по идентификатору запроса.
Роботы могут гибко изменять поведение модели для каждого запроса с помощью специальных свойств элементов.
Для отправки запросов из внешних систем доступен API, спецификация которого описана по стандарту Open API.
Компонент Умный OCR
Добавили обученную модель Any Text, которая умеет распознавать текст в сканах документов произвольной формы. Модель подходит для распознавания актов, договоров и любых других неструктурированных документов на белом фоне.
Протестировать возможности модели вы можете в рамках встроенного проекта Неструктурированный документ. Результат распознавания — текст документа — в дальнейшем можно использовать в компоненте AI Текст.
Появился инструмент автоматической разметки данных — теперь стало проще и быстрее размечать данные в сканах документов. Для этого подготовьте несколько примеров корректно размеченных изображений и обучите на их основе модель, которая сможет самостоятельно разметить оставшиеся сканы документов. Функция доступна на панели инструментов в разделе Разметка данных — инструмент становится активным, как только вы разметите несколько изображений. При выборе инструмента осуществится переход на страницу создания шаблонов автоматической разметки.
В проектах типа Умный OCR появилась страница Тестирование — загружайте тестовые сканы документов, чтобы оценить качество распознавания или классификации обученной модели. Функция позволяет протестировать различные сценарии использования и выявить возможные проблемы до начала использования модели на реальных данных.
Last updated