AI Server 1.26.3.1
Ключевые обновления
-
Добавлен новый тип проекта Агентская система
Новый тип проекта позволяет создавать и настраивать агентские сценарии для построения цепочек ИИ-агентов и инструментов. -
Добавлены новые семейства
base-LLM-11-9bв 3 версиях:-
vLLM:
-
Ollama:
- base-LLM-11-9b-gguf-q4_k_m (q4_k_m)
Новые модели мультимодальные, могут использоваться как в NLP-запросах, так и как ViT-механизм для Умного OCR.
-
-
Повышена точность распознавания в проектах Умный OCR
- Добавлены параметры конфигурации:
D2Confidence: Порог уверенности нейросети; чем выше, тем строже отбор символов.BaseLanguage: Основной язык словаря для проверки орфографии.ImArea: Область интереса на картинке, где именно искать текст.RowSpacing / ColumnSpacing: Интервалы между строками и колонками для группировки текста.RowPeakThreshold / ColumnPeakThreshold: Чувствительность поиска границ строк и колонок по плотности пикселей.TransitionPenalty: Штраф за «переходы».RowSpacing / ColumnSpacing: Специфичные интервалы именно внутри табличной сетки.GapBudget: Допустимый суммарный объем пустот внутри ячейки.MaxGapSize: Максимальный размер одиночного разрыва, который еще не считается концом ячейки.LambdaSmooth: Коэффициент сглаживания кривых линий таблиц.
- Добавлена фильтрация символов пунктуации для таблиц
- Оптимизирован алгоритм поиска объединенных ячеек таблиц
- Добавлены параметры конфигурации:
Улучшения
- Добавлена кнопка Остановить при запуске NLP-процесса.
- Добавлены иконки Сохранить рядом с параметрами:
- ключи ответа
- Температура
min_p- Контекст
- системное сообщение
- Добавлены иконки Восстановить рядом с параметрами:
- ключи ответа
- Температура
min_p
- Оптимизирован процесс создания конфигурации использования.
- Добавили кнопку для быстрого переименования конфигурации прямо из карточки.
- Реализовано хранение параметров тестирования в Навыке.
- Обновили модель УПД: расширили набор распознаваемых полей и существенно повысили точность детекции данных.
- Оптимизировали создание и настройку конфигураций использования.
- Повысили стабильность сессии. Уменьшили количество ситуаций, когда требуется повторный вход в систему.
- Внедрили индикатор загрузки (троббер) при запуске процессов LLM, RAG и Исполнителей. Кнопка Запустить теперь блокируется до завершения операции, что исключает ошибки при случайных повторных нажатиях.
- Настроили автоматический возврат в систему: после авторизации вы попадете именно на ту страницу, с которой вышли из аккаунта или были разлогинены.
- Реализован механизм авторизации на основе Cookie.
- Добавлена поддержка
Refresh Tokenдля бесшовного обновления сессии.
Страница Машины
- Раздел AI Текст теперь разделен на три независимых модуля управления:
- LLM (ранее основной блок AI Текст).
- Исполнитель агентских систем.
- RAG-сервер.
- Добавлены отдельные карточки для Исполнителя агентских систем и RAG-сервера по аналогии с основным модулем LLM.
- В настройках модулей теперь отображаются только релевантные параметры конфигурации (выбор устройства CPU/GPU и количество используемых ядер).
- Для всех новых модулей (Исполнителя агентских систем и RAG) внедрена детальная визуализация стадий запуска (подготовка хранилища, скачивание моделей и т.д.), аналогично блоку NLP.
- Разделы в списке стали полностью кликабельными. Теперь развернуть блок можно нажатием на любую область заголовка, а не только на иконку-экспандер.
- Добавлена возможность просмотра и выгрузки логов для каждого раздела (LLM, Исполнитель, RAG) непосредственно из интерфейса карточки машины.
- В компактном виде карточки машины теперь отображаются статусы всех трех систем (LLM, Исполнитель, RAG) без лишней информации о моделях, что позволяет быстро оценить работоспособность узла.
- Переименованы пункты меню и заголовки блоков для приведения к единому стандарту (AI Текст → LLM).
- Добавили список активных процессов Файнтюнинг в разделе AI Текст. Теперь под каждым проектом сразу видно, что запущено в данный момент.
- Разместили кнопку Смотреть все процессы для удобного перехода к полному списку задач.
- Добавлен расчет доступной и недостающей видеопамяти при ошибке запуска моделей.
Исправления
- Исправлено отображение статусов в мини-виджетах, которые могли некорректно дублировать состояние основного блока LLM.
- Исправлены ошибки сборка информации о машине в Использовании проекта NLP.