Skip to Content

AI Server 1.25.10.0

Ключевые обновления

  • Редизайн Умного OCR
    Полностью обновлены ключевые разделы: наполнение датасета, обучение, использование моделей и тестирование.

    Улучшения:

    • детально проработан UI/UX при работе с компонентом;
    • проще наполнять датасет;
    • проще конфигурировать обучение;
    • для датасетов появился «слепок» с метаинформацией и возможностью скачать архив, использованный при конкретном обучении модели;
    • проще конфигурировать использование моделей (ранее инференс).
  • Новая архитектура
    Выделен отдельный IDP-сервер (см. схему архитектуры).

  • Гибкая настройка ViT

    • Реализована настройка движка OCR для каждого поля в отдельности
    • Для ViT появилась возможность указать особый запрос к модели для отдельных полей

    Это позволит существенно повысить качество распознавания сложных документов и снизить нагрузку на GPU.

    Например, простые числовые поля можно обрабатывать Tesseract, а для сложных полей можно указать контекст (например, “в этом поле указан адрес организации, включая индекс, город и т.д., например: (примеры)“)

Улучшения

  • Отказ от ручной настройки типов модели и ключей маршрутизации; теперь они формируются автоматически.

  • Добавлен блок Качество датасета:
    image.png

  • Добавлена возможность экспорта и импорта схемы разметки.

  • Реализована отдельная страница архивов датасетов: скачивание, удаление старых версий, экспорт и импорт (в том числе в режимах replace и append).

  • Полностью переработана авторазметка:

    • упрощён запуск (только выбор модели и машины);
    • предпросмотр результатов до применения на датасете;
    • прогресс выполнения в %;
    • страница с результатами обновляется в процессе.
  • Полностью переработан автотест (ранее тестовый инференс):

    • упрощён запуск (только выбор машины);
    • прогресс выполнения в %;
    • страница с результатами обновляется в процессе.
  • Обновлены vLLM и Ollama (сборки и окружения).

  • Обновлены зависимости: переход с Python 3.11 на Python 3.12, базовые образы обновлены с Astra 1.8 на Ubuntu 24.04.

  • Встроен venv в Docker-образы. Образы разделены на три:

    • ai-server-smartocr-cpu
    • ai-server-smartocr-gpu
    • ai-server-logics
  • Добавлены всплывающие подсказки (tooltips) при наведении на кнопки Повторить запрос и Копировать ответ.

  • Реализована работа с многостраничными документами в NLP, а также при наполнении датасетов в Умном OCR.

    • Добавлено числовое поле Лимит изображений (от 1 до 20) справа от размера контекста. Только для мультимодальных vLLM.
  • Добавлена отдельная страница просмотра результатов автотеста.

  • Поддерживаются файлы TIFF/PDF в разметке/обучении.

  • Реализована подгрузка многостраничных изображений TIFF/PDF.

  • В UI отображается числовое поле с результатами оценки в процентах:

    • в Каталоге моделей (раздел Использование)
    • в заголовке конкретного процесса (раздел Обучение).
  • В UI задач NLP теперь можно загружать TIFF/PDF.

Изменения

  • Образ целевой машины (primo-rpa/ai-server-smartocr) теперь не включает отдельного агента, только IDP-сервер (primo-rpa/ai-server-smartocr-cpu / primo-rpa/ai-server-smartocr-gpu).
  • Переименован тип проекта с Распознавание на Распознавание документов утверждённой формы.
  • Прекращена поддержка тёмной темы.
  • Скрыты разделы Ключи маршрутизации и Типы моделей на странице настроек.
  • Поле Ключ маршрутизации теперь генерируется автоматически и доступно только для копирования в readonly-режиме.

Исправленные ошибки

  • Повышена стабильность сервисов: устранены проблемы, влияющие на сборку и запуск.
  • Повышена надёжность агентов: исправлены проблемы стабильности и инициализации.
  • Исправлен стиль красного прямоугольника для ViT:
    image.png
  • Обновлена логика интерпретации угла поворота со знаком «минус»; документы теперь ориентируются правильно. Поворот на 180° по-прежнему работает корректно.
  • Реализовано окно предупреждения для пользователей с недостаточными правами:
    image.png
    Ранее в таких случаях выполнялся выход из системы.
  • Исправлена логика хранения файлов контекста: теперь они отвязаны от ключей маршрутизации (по аналогии с системным промптом)
  • Добавлен процент выполнения обучения:
    image.png

Инструкция по обновлению AI Server

Обновление 1.25.4.5 → 1.25.10.0 — ограничивается вариантом установки через Docker.