AI Server 1.25.10.0

Ключевые обновления

Редизайн Умного OCR
Полностью обновлены ключевые разделы: наполнение датасета, обучение, использование моделей и тестирование.

Улучшения:
- детально проработан UI/UX при работе с компонентом;
- проще наполнять датасет;
- проще конфигурировать обучение;
- для датасетов появился «слепок» с метаинформацией и возможностью скачать архив, использованный при конкретном обучении модели;
- проще конфигурировать использование моделей (ранее инференс).
Новая архитектура
Выделен отдельный IDP-сервер (см. схему архитектуры ).
Гибкая настройка ViT
- Реализована настройка движка OCR для каждого поля в отдельности
- Для ViT появилась возможность указать особый запрос к модели для отдельных полей
Это позволит существенно повысить качество распознавания сложных документов и снизить нагрузку на GPU.

Например, простые числовые поля можно обрабатывать Tesseract, а для сложных полей можно указать контекст (например, “в этом поле указан адрес организации, включая индекс, город и т.д., например: (примеры)“)

Улучшения

Отказ от ручной настройки типов модели и ключей маршрутизации; теперь они формируются автоматически.
Добавлен блок Качество датасета:
Добавлена возможность экспорта и импорта схемы разметки.
Реализована отдельная страница архивов датасетов: скачивание, удаление старых версий, экспорт и импорт (в том числе в режимах replace и append).
Полностью переработана авторазметка:
- упрощён запуск (только выбор модели и машины);
- предпросмотр результатов до применения на датасете;
- прогресс выполнения в %;
- страница с результатами обновляется в процессе.
Полностью переработан автотест (ранее тестовый инференс):
- упрощён запуск (только выбор машины);
- прогресс выполнения в %;
- страница с результатами обновляется в процессе.
Обновлены vLLM и Ollama (сборки и окружения).
Обновлены зависимости: переход с Python 3.11 на Python 3.12, базовые образы обновлены с Astra 1.8 на Ubuntu 24.04.
Встроен venv в Docker-образы. Образы разделены на три:
- ai-server-smartocr-cpu
- ai-server-smartocr-gpu
- ai-server-logics
Добавлены всплывающие подсказки (tooltips) при наведении на кнопки Повторить запрос и Копировать ответ.
Реализована работа с многостраничными документами в NLP, а также при наполнении датасетов в Умном OCR.
- Добавлено числовое поле Лимит изображений (от 1 до 20) справа от размера контекста. Только для мультимодальных vLLM.
Добавлена отдельная страница просмотра результатов автотеста.
Поддерживаются файлы TIFF/PDF в разметке/обучении.
Реализована подгрузка многостраничных изображений TIFF/PDF.
В UI отображается числовое поле с результатами оценки в процентах:
- в Каталоге моделей (раздел Использование)
- в заголовке конкретного процесса (раздел Обучение).
В UI задач NLP теперь можно загружать TIFF/PDF.

Изменения

Образ целевой машины (primo-rpa/ai-server-smartocr) теперь не включает отдельного агента, только IDP-сервер (primo-rpa/ai-server-smartocr-cpu / primo-rpa/ai-server-smartocr-gpu).
Переименован тип проекта с Распознавание на Распознавание документов утверждённой формы.
Прекращена поддержка тёмной темы.
Скрыты разделы Ключи маршрутизации и Типы моделей на странице настроек.
Поле Ключ маршрутизации теперь генерируется автоматически и доступно только для копирования в readonly-режиме.

Исправленные ошибки

Повышена стабильность сервисов: устранены проблемы, влияющие на сборку и запуск.
Повышена надёжность агентов: исправлены проблемы стабильности и инициализации.
Исправлен стиль красного прямоугольника для ViT:
Обновлена логика интерпретации угла поворота со знаком «минус»; документы теперь ориентируются правильно. Поворот на 180° по-прежнему работает корректно.
Реализовано окно предупреждения для пользователей с недостаточными правами:

Ранее в таких случаях выполнялся выход из системы.
Исправлена логика хранения файлов контекста: теперь они отвязаны от ключей маршрутизации (по аналогии с системным промптом)
Добавлен процент выполнения обучения:

Инструкция по обновлению AI Server

Обновление 1.25.4.5 → 1.25.10.0 — ограничивается вариантом установки через Docker.