Запуск обучения модели
Шаг 1. Проверьте качество датасета
Откройте блок Качество датасета.
Убедитесь, что все нужные поля выделены зелёным цветом.
Если какое-либо поле подсвечено красным, значит оно не размечено или процент размеченных областей поля слишком низок (менее 20% от максимума среди других полей проекта) и модель не сможет находить это поле, или будет находить его слишком плохо. В этом случае вернитесь в раздел Датасет и добавьте нужные метки.
Шаг 2. Выберите целевую машину
- Обучение модели ресурсоёмкое. Для ускорения рекомендуется запускать его на GPU: на графическом процессоре процесс выполняется значительно быстрее, чем на CPU. - Целевая машина заранее настраивается администратором. Если у вас нет доступных и включенных целевых машин, обратитесь к вашему администратору AI Server.
В выпадающем списке Целевая машина выберите доступный сервер. Убедитесь, что машина включена и доступна.
Шаг 3. Укажите параметры обучения
-
Кол-во итераций в расчетах – выберите количество обучающих шагов (по умолчанию -
1000)
. Минимальное значение -200
.
Модель, готовую к промышленной эксплуатации, следует обучать на 5000+ итераций. -
Базовая модель – выберите базовые веса модели, от которой будет производиться обучение детекции полей.
В комплект поставки входит базовая модель base-SmartOCR-01. -
Начальный коэф обучения – по умолчанию
0.005
.
Начальный коэффициент (learning rate ) определяет размер шага, с которым модель обновляет веса в процессе обучения. Параметр влияет на то, насколько быстро или медленно модель сходится к оптимальным весам, а также на результат обучения.Примечания:
- Если выбрать слишком маленький начальный коэффициент (например, 0,0005), то процесс обучения значительно затянется.
- Если выбрать слишком большой начальный коэффициент (например, 0,01), то скорость обучения повысится, но модель может “перепрыгнуть” оптимальные значения весов и, в худшем случае, не сойдется к правильному решению.
Шаг 4. Настройте расширенные параметры (опционально)
Нажмите Расширенные параметры, чтобы открыть дополнительные настройки:
Поле | Значение по умолчанию | Описание |
---|---|---|
Кол-во процессов для загрузки датасета | 8 | Количество процессов для загрузки данных в модель, по умолчанию 8. Значение не должно превышать количество физических ядер CPU в целевой машине. Рекомендации: Если целевая машина обладает высокопроизводительными характеристиками, вы можете увеличить это значение. Не рекомендуется устанавливать значение ниже 4, так как это замедлит обучение. |
Искусственно расширить датасет | повороты + экспозиция + шум | Определите, следует ли расширять датасет с помощью модификации входящих в него изображений. Например, за счет поворотов на 90/180/270 градусов, изменения экспозиции случайным образом и добавления шума. Возможные значения: повороты + экспозиция + шум — значение по умолчанию, которое повышает качество обучения модели. экспозиция + шум — применять только изменение экспозиции и добавление шума. нет — не применять модификацию изображений. Установка этого значения повысит скорость обучения, но может снизить его качество. |
Кол-во картинок, используемых в расчетах на одной итерации | 2 | Количество изображений, которые загружаются в модель в одной итерации (batch size ). По умолчанию 2. Рекомендации: Увеличение количества изображений в итерации помогает ускорить обучение, но требует больше памяти. Если на целевой машине используется GPU, и вы столкнулись с ошибкой out of memory, то следует уменьшить значение в данном параметре. Должно быть меньше, чем Кол-во процессов для загрузки датасета. Должно быть меньше кол-ва изображений в датасете Обучение. |
Устройство | CUDA | Определяет, какой компонент целевой машины требуется использовать для процесса обучения. Возможные значения: CUDA: позволяет использовать графический процессор (GPU) от NVIDIA для повышения производительности параллельных вычислений. CUDA представляет собой набор инструментов и библиотек для работы с графическим процессором. CPU: центральный процессор, выполняющий основные операции и управляющий работой компьютера. |
Время обновления файла (сек) | 60 | Интервал обновления файла логов обучения. По умолчанию 60. ⚠ Не рекомендуется изменять это значение. |
Шаг 5. Задайте имя модели *(опционально)
В поле Название модели можно указать название вручную. Оно должно состоять только из букв и цифр, дефиса, подчеркивания и точки.
Если оставить пустым, то имя будет сгенерировано автоматически.
Шаг 6. Запустите обучение
Нажмите кнопку Обучить.
Процесс начнется на выбранной машине с указанными параметрами.
Что дальше
Следующий шаг — Проверка результатов .