Skip to Content

Пошаговое руководство

Настоящее руководство по шагам опишет базовый алгоритм для обучения языковой модели.

  1. Создайте проект AI Текст -> Задачи NLP.
  2. Перейдите в редактор Файнтюнинга (Файнтюнинг моделей” -> Перейти в редактор)
  3. Выберите базовые параметры:
    • Базовая модель: оставьте значение по-умолчанию, base-LLM-10-4b-safetensors-base (vLLM, 4B)
    • Наименование модели: укажите, как будет называться модель.
    • Целевая машина: выберите машину со свободной GPU.
  4. Сбалансируйте датасет.
    • Загрузите xlsx-файл с данными, содержащими запрос к модели и правильный ответ на него.
    • Сконфигурируйте балансировку: нажмите на иконку карандаша, укажите input_col (имя столбца с запросом к модели), output_col (имя столбца с ответом модели) и sheet_name (имя листа, на котором находятся эти два столбца). Остальные значения можно оставить стандартными.
    • Нажмите Сбалансировать
    • Дождитесь результатов балансировки.
  5. Укажите параметры файнтюнинга. Для первого попытки можно оставить стандартные значения.
  6. Нажмите Запустить.
  7. Дождитесь завершения процесса.
    • Оцените параметры, указанные в таблице: acc (точность), loss (потери), f1_macro (отражает точность без учета веса класса).
    • Оцените Результат - процент ошибок, галлюцинаций.
  8. Если результаты процесса неудовлетворительные, измените параметры и повторите процесс.
    • Получите 2-ю, 3-ю и последующие версии модели, пока не достигните целевых показателей
    • Менять можно как исходный несбалансированный датасет, параметры балансировки, базовую модель, параметры файнтюнинга, включая шаблон запроса и квантизацию
    • Сравнивайте результаты между собой бегло по таблице
    • Выбирайте запись в таблице, чтобы детально оценить версию модели
  9. Когда получены потребные показатели модели, нажмите “+” (добавить в каталог).
  10. Дождитесь добавления модели в каталог.
  11. Вернитесь в раздел Модели проекта.
  12. Выберите модель с меткой “ФТ”.
  13. Перейдите в раздел Навыки.
  14. Создайте навык Файнтюнинг.
  15. Перейдите в раздел Использование.
  16. Выберите наиболее подходящую по конфигурации машину.
  17. Перейдите в раздел Машины.
  18. Выберите модель по имени, указанному в п.3, и нажмите кнопку Использовать.
  19. Вернитесь в проект.
  20. Перейдите в раздел Тестирование.
  21. Вставьте в поле Текст для обработки любое значение запроса к модели, которое нужно обработать (например, из столбца input_col в несбалансированном датасете).
  22. Нажмите кнопку Отправить и дождитесь ответа модели.
  23. Убедитесь, что модель генерирует ответ в виде кода, который затем преобразуется в класс из предоставленного датасета (столбец output_col).
  24. При необходимости вернитесь к процессу файнтюнинга модели, чтобы получить более высокие показатели точности.
  25. Удалите лишние модели из хранилища на Целевой машине, нажав соответствующую иконку в Редакторе файнтюнинга.