Пошаговое руководство
Настоящее руководство по шагам опишет базовый алгоритм для обучения языковой модели.
- Создайте проект AI Текст -> Задачи NLP.
- Перейдите в редактор Файнтюнинга (Файнтюнинг моделей” -> Перейти в редактор)
- Выберите базовые параметры:
- Базовая модель: оставьте значение по-умолчанию,
base-LLM-10-4b-safetensors-base (vLLM, 4B) - Наименование модели: укажите, как будет называться модель.
- Целевая машина: выберите машину со свободной GPU.
- Базовая модель: оставьте значение по-умолчанию,
- Сбалансируйте датасет.
- Загрузите
xlsx-файл с данными, содержащими запрос к модели и правильный ответ на него. - Сконфигурируйте балансировку: нажмите на иконку карандаша, укажите
input_col(имя столбца с запросом к модели),output_col(имя столбца с ответом модели) иsheet_name(имя листа, на котором находятся эти два столбца). Остальные значения можно оставить стандартными. - Нажмите Сбалансировать
- Дождитесь результатов балансировки.
- Загрузите
- Укажите параметры файнтюнинга. Для первого попытки можно оставить стандартные значения.
- Нажмите Запустить.
- Дождитесь завершения процесса.
- Оцените параметры, указанные в таблице:
acc(точность),loss(потери),f1_macro(отражает точность без учета веса класса). - Оцените Результат - процент ошибок, галлюцинаций.
- Оцените параметры, указанные в таблице:
- Если результаты процесса неудовлетворительные, измените параметры и повторите процесс.
- Получите 2-ю, 3-ю и последующие версии модели, пока не достигните целевых показателей
- Менять можно как исходный несбалансированный датасет, параметры балансировки, базовую модель, параметры файнтюнинга, включая шаблон запроса и квантизацию
- Сравнивайте результаты между собой бегло по таблице
- Выбирайте запись в таблице, чтобы детально оценить версию модели
- Когда получены потребные показатели модели, нажмите “+” (добавить в каталог).
- Дождитесь добавления модели в каталог.
- Вернитесь в раздел Модели проекта.
- Выберите модель с меткой “ФТ”.
- Перейдите в раздел Навыки.
- Создайте навык Файнтюнинг.
- Перейдите в раздел Использование.
- Выберите наиболее подходящую по конфигурации машину.
- Перейдите в раздел Машины.
- Выберите модель по имени, указанному в п.3, и нажмите кнопку Использовать.
- Вернитесь в проект.
- Перейдите в раздел Тестирование.
- Вставьте в поле Текст для обработки любое значение запроса к модели, которое нужно обработать (например, из столбца
input_colв несбалансированном датасете). - Нажмите кнопку Отправить и дождитесь ответа модели.
- Убедитесь, что модель генерирует ответ в виде кода, который затем преобразуется в класс из предоставленного датасета (столбец
output_col). - При необходимости вернитесь к процессу файнтюнинга модели, чтобы получить более высокие показатели точности.
- Удалите лишние модели из хранилища на Целевой машине, нажав соответствующую иконку в Редакторе файнтюнинга.