AI Server 1.24.12
История изменений в версии 1.24.12, выпущенной в декабре 2024-го года.
Информацию по обновленным релизам версии 1.24.12 можно найти в разделах:
Компонент AI текст
Для обработки информации на естественном языке появился компонент с большими языковыми моделями (LLM). Модели анализируют указанный произвольный текст и используют его при генерации ответов. Работать с моделями возможно в закрытом контуре для защиты чувствительных данных.
Что умеют LLM-модели:
- Извлекать из текста информацию — помогут найти номер договора, дату и другие данные.
- Классифицировать текст — рассортируют письма из общего ящика организации.
- Суммировать информацию из текста — расскажут самое важное из длинного текста.
- Создавать текст — напишут вакансию под указанные параметры.
Перечисленные возможности моделей получили название навыки. Модель может обладать одним или сразу несколькими навыками для решения корпоративных задач.
Особенности работы компонента:
- LLM-модели не требуют обучения.
- Работа с моделями осуществляется в проекте с типом NLP-задачи (Natural Language Processing) — задачи по обработке естественного языка.
- Конфигурация и запуск модели выполняются на одной странице проекта — минимизировано количество шагов для использования модели.
- Существует возможность протестировать модель до начала эксплуатации — сервис предоставляет UI-инструмент для отправки тестовых запросов и отладки поведения модели.
- Поведение модели можно улучшить с помощью файла контекста, где прописываются примеры ответов на однотипные запросы.
- Для отправки запросов роботами доступны следующие элементы в пакете Primo.AI.Server:
- Создать запрос NLP — отправляет запрос к Server AI для обработки текста на естественном языке и сохраняет идентификатор запроса.
- Получить результат NLP — получает результат обработки текста по идентификатору запроса.
- Роботы могут гибко изменять поведение модели для каждого запроса с помощью специальных свойств элементов.
- Для отправки запросов из внешних систем доступен API, спецификация которого описана по стандарту Open API.
Компонент Умный OCR
-
Добавили обученную модель Any Text, которая умеет распознавать текст в сканах документов произвольной формы. Модель подходит для распознавания актов, договоров и любых других неструктурированных документов на белом фоне.
Протестировать возможности модели вы можете в рамках встроенного проекта Неструктурированный документ. Результат распознавания — текст документа — в дальнейшем можно использовать в компоненте AI Текст.
-
Появился инструмент автоматической разметки данных — теперь стало проще и быстрее размечать данные в сканах документов. Для этого подготовьте несколько примеров корректно размеченных изображений и обучите на их основе модель, которая сможет самостоятельно разметить оставшиеся сканы документов. Функция доступна на панели инструментов в разделе Разметка данных — инструмент становится активным, как только вы разметите несколько изображений. При выборе инструмента осуществится переход на страницу создания шаблонов автоматической разметки.
-
В проектах типа Умный OCR появилась страница Тестирование — загружайте тестовые сканы документов, чтобы оценить качество распознавания или классификации обученной модели. Функция позволяет протестировать различные сценарии использования и выявить возможные проблемы до начала использования модели на реальных данных.