Обучение модели предсказания

Prediction model training

Элемент производит обучение модели предсказания данных. Модель обучается на основе входных данных (файл CSV), который указывается в свойствах элемента.

В результате выполнения элемента вы получите модель — файл, который обучен распознаванию определенных типов закономерностей.

Свойства

Символ * в названии свойства указывает на обязательность заполнения. Описание общих свойств см. в разделе Свойства элемента.

Входные данные

  1. Имя файла* [String] — путь к файлу CSV, содержащему данные для обучения. Пример: System.IO.Path.Combine(_Workflow.ProjectPath, "Data\\file_name.csv").

  2. Номер основной колонки* [Int32] — номер колонки, содержащей предсказываемое значение. Значение по умолчанию: 0.

  3. Номер колонок данных* [String] — номера колонок, содержащих данные. Значение по умолчанию: "1-4".

  4. Разделитель* [String] — разделитель колонок CSV. Значение по умолчанию: ";".

  5. Путь к модели* [String] — путь сохранения файла модели. Пример: System.IO.Path.Combine(_Workflow.ProjectPath, "Models\\model.ml").

  6. Тип алгоритма* — тип алгоритма обучения модели. Чтобы выбрать нужный тип, кликните по списку значений параметра. Доступные значения:

    • Poisson_Regression — значение по умолчанию. «Регрессия Пуассона» является статистическим методом, который используется для моделирования зависимости между независимыми переменными и целевой переменной, представляющей собой счетные данные. Часто применяется в случаях, когда целевая переменная представляет собой количество событий или частоту событий, такие как число заявок на сайте, количество аварий на дороге и т. д.

    • Online_Gradient_Descent — представляет собой метод оптимизации, который используется для обновления параметров модели по мере получения новых данных. Метод основан на итеративном обновлении весов модели с учетом градиента функции потерь по каждому примеру из обучающего набора данных.

    • Fast_Tree — метод обучения, который используется для построения ансамблей деревьев решений. Эффективный и быстрый алгоритм, который может быть использован для задач классификации и регрессии. Обычно используется в задачах с большими объемами данных или когда требуется быстрое обучение модели.

    • Fast_Forest — вариант алгоритма случайного леса, который используется для построения ансамблей деревьев решений. Метод включает в себя оптимизации и улучшения, которые позволяют ему работать быстрее и эффективнее, чем классический случайный лес.

Вывод

Как использовать модель

Чтобы применить обученную модель для предсказания данных, воспользуйтесь элементом Предсказание.

Пример использования

На странице Learning доступен RPA-проект, демонстрирующий работу элемента.

  1. Скачайте архив со всеми обучающими материалами по ссылке: Скачать архив Learning.

  2. Распакуйте архив, запустите Primo Studio и откройте проект MachineLearning.

  3. Выберите процесс Prediction.ltw для просмотра.

Last updated