AI Server 1.25.10.0
Ключевые обновления
-
Редизайн Умного OCR
Полностью обновлены ключевые разделы: наполнение датасета, обучение, использование моделей и тестирование.Улучшения:
- детально проработан UI/UX при работе с компонентом;
- проще наполнять датасет;
- проще конфигурировать обучение;
- для датасетов появился «слепок» с метаинформацией и возможностью скачать архив, использованный при конкретном обучении модели;
- проще конфигурировать использование моделей (ранее инференс).
-
Новая архитектура
Выделен отдельный IDP-сервер (см. схему архитектуры ). -
Гибкая настройка ViT
- Реализована настройка движка OCR для каждого поля в отдельности
- Для ViT появилась возможность указать особый запрос к модели для отдельных полей
Это позволит существенно повысить качество распознавания сложных документов и снизить нагрузку на GPU.
Например, простые числовые поля можно обрабатывать Tesseract, а для сложных полей можно указать контекст (например, “в этом поле указан адрес организации, включая индекс, город и т.д., например: (примеры)“)
Улучшения
-
Отказ от ручной настройки типов модели и ключей маршрутизации; теперь они формируются автоматически.
-
Добавлен блок Качество датасета:
-
Добавлена возможность экспорта и импорта схемы разметки.
-
Реализована отдельная страница архивов датасетов: скачивание, удаление старых версий, экспорт и импорт (в том числе в режимах replace и append).
-
Полностью переработана авторазметка:
- упрощён запуск (только выбор модели и машины);
- предпросмотр результатов до применения на датасете;
- прогресс выполнения в %;
- страница с результатами обновляется в процессе.
-
Полностью переработан автотест (ранее тестовый инференс):
- упрощён запуск (только выбор машины);
- прогресс выполнения в %;
- страница с результатами обновляется в процессе.
-
Обновлены vLLM и Ollama (сборки и окружения).
-
Обновлены зависимости: переход с Python 3.11 на Python 3.12, базовые образы обновлены с Astra 1.8 на Ubuntu 24.04.
-
Встроен
venv
в Docker-образы. Образы разделены на три:ai-server-smartocr-cpu
ai-server-smartocr-gpu
ai-server-logics
-
Добавлены всплывающие подсказки (tooltips) при наведении на кнопки Повторить запрос и Копировать ответ.
-
Реализована работа с многостраничными документами в NLP, а также при наполнении датасетов в Умном OCR.
- Добавлено числовое поле Лимит изображений (от 1 до 20) справа от размера контекста. Только для мультимодальных vLLM.
-
Добавлена отдельная страница просмотра результатов автотеста.
-
Поддерживаются файлы TIFF/PDF в разметке/обучении.
-
Реализована подгрузка многостраничных изображений TIFF/PDF.
-
В UI отображается числовое поле с результатами оценки в процентах:
- в Каталоге моделей (раздел Использование)
- в заголовке конкретного процесса (раздел Обучение).
-
В UI задач NLP теперь можно загружать TIFF/PDF.
Изменения
- Образ целевой машины (
primo-rpa/ai-server-smartocr
) теперь не включает отдельного агента, только IDP-сервер (primo-rpa/ai-server-smartocr-cpu / primo-rpa/ai-server-smartocr-gpu
). - Переименован тип проекта с Распознавание на Распознавание документов утверждённой формы.
- Прекращена поддержка тёмной темы.
- Скрыты разделы Ключи маршрутизации и Типы моделей на странице настроек.
- Поле Ключ маршрутизации теперь генерируется автоматически и доступно только для копирования в readonly-режиме.
Исправленные ошибки
- Повышена стабильность сервисов: устранены проблемы, влияющие на сборку и запуск.
- Повышена надёжность агентов: исправлены проблемы стабильности и инициализации.
- Исправлен стиль красного прямоугольника для ViT:
- Обновлена логика интерпретации угла поворота со знаком «минус»; документы теперь ориентируются правильно. Поворот на 180° по-прежнему работает корректно.
- Реализовано окно предупреждения для пользователей с недостаточными правами:
Ранее в таких случаях выполнялся выход из системы. - Исправлена логика хранения файлов контекста: теперь они отвязаны от ключей маршрутизации (по аналогии с системным промптом)
- Добавлен процент выполнения обучения:
Инструкция по обновлению AI Server
Обновление 1.25.4.5 → 1.25.10.0 — ограничивается вариантом установки через Docker.