Обучение модели предсказания
Элемент производит обучение модели предсказания данных. Модель обучается на основе входных данных (файл CSV), который указывается в свойствах элемента.
В результате выполнения элемента вы получите модель — файл, который обучен распознаванию определенных типов закономерностей.
Свойства
Символ *
в названии свойства указывает на обязательность заполнения. Описание общих свойств см. в разделе Свойства элемента.
Входные данные
- Имя файла* [String] — путь к файлу CSV, содержащему данные для обучения. Пример:
System.IO.Path.Combine(_Workflow.ProjectPath, "Data\\file_name.csv")
. - Номер основной колонки* [Int32] — номер колонки, содержащей предсказываемое значение. Значение по умолчанию:
0
. - Номер колонок данных* [String] — номера колонок, содержащих данные. Значение по умолчанию:
"1-4"
. - Разделитель* [String] — разделитель колонок CSV. Значение по умолчанию:
";"
. - Путь к модели* [String] — путь сохранения файла модели. Пример:
System.IO.Path.Combine(_Workflow.ProjectPath, "Models\\model.ml")
. - Тип алгоритма* — тип алгоритма обучения модели. Чтобы выбрать нужный тип, кликните по списку значений параметра. Доступные значения:
- Poisson_Regression — значение по умолчанию. «Регрессия Пуассона» является статистическим методом, который используется для моделирования зависимости между независимыми переменными и целевой переменной, представляющей собой счетные данные. Часто применяется в случаях, когда целевая переменная представляет собой количество событий или частоту событий, такие как число заявок на сайте, количество аварий на дороге и т. д.
- Online_Gradient_Descent — представляет собой метод оптимизации, который используется для обновления параметров модели по мере получения новых данных. Метод основан на итеративном обновлении весов модели с учетом градиента функции потерь по каждому примеру из обучающего набора данных.
- Fast_Tree — метод обучения, который используется для построения ансамблей деревьев решений. Эффективный и быстрый алгоритм, который может быть использован для задач классификации и регрессии. Обычно используется в задачах с большими объемами данных или когда требуется быстрое обучение модели.
- Fast_Forest — вариант алгоритма случайного леса, который используется для построения ансамблей деревьев решений. Метод включает в себя оптимизации и улучшения, которые позволяют ему работать быстрее и эффективнее, чем классический случайный лес.
Вывод
- Результат [Aura.MachineLearning.Model.PredictionTrainingResult] — результат обучения модели.
Как использовать модель
Чтобы применить обученную модель для предсказания данных, воспользуйтесь элементом Предсказание.
Пример использования
На странице Learning доступен RPA-проект, демонстрирующий работу элемента.
- Скачайте архив со всеми обучающими материалами по ссылке: Скачать архив Learning .
- Распакуйте архив, запустите Primo Studio и откройте проект MachineLearning.
- Выберите процесс
Prediction.ltw
для просмотра.