Skip to Content

Запуск обучения модели

Шаг 1. Проверьте качество датасета

Откройте блок Качество датасета.
Убедитесь, что все нужные поля выделены зелёным цветом.

Если какое-либо поле подсвечено красным, значит оно не размечено или процент размеченных областей поля слишком низок (менее 20% от максимума среди других полей проекта) и модель не сможет находить это поле, или будет находить его слишком плохо. В этом случае вернитесь в раздел Датасет и добавьте нужные метки.

alt

Шаг 2. Выберите целевую машину

⚠️
  • Обучение модели ресурсоёмкое. Для ускорения рекомендуется запускать его на GPU: на графическом процессоре процесс выполняется значительно быстрее, чем на CPU. - Целевая машина заранее настраивается администратором. Если у вас нет доступных и включенных целевых машин, обратитесь к вашему администратору AI Server.

В выпадающем списке Целевая машина выберите доступный сервер. Убедитесь, что машина включена и доступна.

Шаг 3. Укажите параметры обучения

  • Кол-во итераций в расчетах – выберите количество обучающих шагов (по умолчанию - 1000). Минимальное значение - 200.
    Модель, готовую к промышленной эксплуатации, следует обучать на 5000+ итераций.

  • Базовая модель – выберите базовые веса модели, от которой будет производиться обучение детекции полей.
    В комплект поставки входит базовая модель base-SmartOCR-01.

  • Начальный коэф обучения – по умолчанию 0.005.
    Начальный коэффициент (learning rate) определяет размер шага, с которым модель обновляет веса в процессе обучения. Параметр влияет на то, насколько быстро или медленно модель сходится к оптимальным весам, а также на результат обучения.

    Примечания:

    • Если выбрать слишком маленький начальный коэффициент (например, 0,0005), то процесс обучения значительно затянется.
    • Если выбрать слишком большой начальный коэффициент (например, 0,01), то скорость обучения повысится, но модель может “перепрыгнуть” оптимальные значения весов и, в худшем случае, не сойдется к правильному решению.

Шаг 4. Настройте расширенные параметры (опционально)

alt

Нажмите Расширенные параметры, чтобы открыть дополнительные настройки:

ПолеЗначение по умолчаниюОписание
Кол-во процессов для загрузки датасета8Количество процессов для загрузки данных в модель, по умолчанию 8. Значение не должно превышать количество физических ядер CPU в целевой машине. Рекомендации: Если целевая машина обладает высокопроизводительными характеристиками, вы можете увеличить это значение. Не рекомендуется устанавливать значение ниже 4, так как это замедлит обучение.
Искусственно расширить датасетповороты + экспозиция + шумОпределите, следует ли расширять датасет с помощью модификации входящих в него изображений. Например, за счет поворотов на 90/180/270 градусов, изменения экспозиции случайным образом и добавления шума. Возможные значения: повороты + экспозиция + шум — значение по умолчанию, которое повышает качество обучения модели. экспозиция + шум — применять только изменение экспозиции и добавление шума. нет — не применять модификацию изображений. Установка этого значения повысит скорость обучения, но может снизить его качество.
Кол-во картинок, используемых в расчетах на одной итерации2Количество изображений, которые загружаются в модель в одной итерации (batch size). По умолчанию 2. Рекомендации: Увеличение количества изображений в итерации помогает ускорить обучение, но требует больше памяти. Если на целевой машине используется GPU, и вы столкнулись с ошибкой out of memory, то следует уменьшить значение в данном параметре. Должно быть меньше, чем Кол-во процессов для загрузки датасета. Должно быть меньше кол-ва изображений в датасете Обучение.
УстройствоCUDAОпределяет, какой компонент целевой машины требуется использовать для процесса обучения. Возможные значения: CUDA: позволяет использовать графический процессор (GPU) от NVIDIA для повышения производительности параллельных вычислений. CUDA представляет собой набор инструментов и библиотек для работы с графическим процессором. CPU: центральный процессор, выполняющий основные операции и управляющий работой компьютера.
Время обновления файла (сек)60Интервал обновления файла логов обучения. По умолчанию 60. ⚠ Не рекомендуется изменять это значение.

Шаг 5. Задайте имя модели *(опционально)

В поле Название модели можно указать название вручную. Оно должно состоять только из букв и цифр, дефиса, подчеркивания и точки.
Если оставить пустым, то имя будет сгенерировано автоматически.

Шаг 6. Запустите обучение

Нажмите кнопку Обучить.
Процесс начнется на выбранной машине с указанными параметрами.

Что дальше

Следующий шаг — Проверка результатов.