Парсер (Parser)

Описание

Компонент Parser предназначен для преобразования структурированных данных (из форматов Data или DataFrame) в текстовый формат Message.

Извлекает нужные значения и оформляет их в виде читаемого сообщения, которое затем можно передать нейросети или вывести в чат.

component6

Режимы работы

У компонента есть два основных режима, которые определяют, как именно данные преобразуются в текст:

Parser (template) mode
Stringify mode

Parser (template) mode

В режиме Parser вы формируете специализированный шаблон для генерации текстового вывода, который может объединять произвольный текст и переменные для подстановки извлеченных ключей.

Для корректной интерпретации данных внутри шаблона необходимо соблюдать следующие технические требования:

Определение переменных
Фигурные скобки используются для обозначения переменных в любой части текстового поля. Имена внутри скобок обязаны строго соответствовать ключам во входящем объекте Data или заголовкам столбцов в DataFrame. Например, конструкция {name} обеспечит извлечение и подстановку значения, связанного с ключом name.
Экранирование символов
В ситуациях, когда шаблон должен содержать визуальные фигурные скобки как часть обычного текста, применяется метод двойного обрамления. Двойные фигурные скобки позволяют экранировать символы, что предотвращает их ошибочное распознавание системой в качестве активных переменных.
Пример синтаксиса Для вывода фразы с техническим пояснением запись должна выглядеть следующим образом: Это шаблон с {{текстом в фигурных скобках}} и {переменной}. В данном случае содержимое в двойных скобках отобразится буквально, а одиночные скобки будут заменены реальными данными из конвейера.

При запуске конвейера компонент Parser перебирает входные данные, создавая отдельное сообщение (Message) для каждого проанализированного элемента. Например, при парсинге DataFrame создается сообщение для каждой строки, заполненное уникальными значениями из этой строки.

Параметры

Ниже перечислены параметры, доступные в режиме Parser.

Некоторые параметры по умолчанию скрыты в визуальном редакторе. Вы можете изменить все параметры через меню Контролы (Управление) в заголовке компонента.

Имя (Name)	Отображаемое имя	Информация
`input_data`	Data или DataFrame	Входной параметр. Данные типа Data или DataFrame для парсинга.
`pattern`	Шаблон (Template)	Входной параметр. Шаблон форматирования, использующий обычный текст и переменные для ключей (`{KEY_NAME}`).
`sep`	Разделитель (Separator)	Входной параметр. Строка, определяющая разделитель для рядов или строк. По умолчанию: `\n` (новая строка).
`clean_data`	Очистка данных (Clean Data)	Указывает, нужно ли удалять пустые ряды и строки в каждой ячейке или ключе входных данных DataFrame или Data. По умолчанию: Включено (`true`).

Stringify mode

Используйте режим Stringify, чтобы преобразовать все входные данные напрямую в текст. Этот режим не поддерживает шаблоны или выбор отдельных ключей.

Параметры

Ниже перечислены параметры, доступные в режиме Stringify.

Имя (Name)	Отображаемое имя	Информация
`input_data`	Data или DataFrame	Входной параметр. Данные типа Data или DataFrame для парсинга.
`sep`	Разделитель (Separator)	Входной параметр. Строка, определяющая разделитель для рядов или строк. По умолчанию: `\n` (новая строка).
`clean_data`	Очистка данных (Clean Data)	Указывает, нужно ли удалять пустые ряды и строки в каждой ячейке или ключе входных данных DataFrame или Data. По умолчанию: Включено (true).

Тестирование и устранение неполадок

Для тестирования функциональности Parser необходимо нажать кнопку Run component (Запустить компонент). После завершения операции следует использовать функцию Inspect output (Просмотр вывода), которая позволяет изучить сформированный объект Message с итоговым текстом.

В качестве альтернативы можно подключить узел к Chat Output для визуализации результата непосредственно в интерфейсе Тестирование.

Диагностика и устранение ошибок

Возникновение пустых или некорректных значений в выходном сообщении зачастую обусловлено ошибками сопоставления, отсутствием данных во входящем конвейере или несовместимостью форматов для текстового извлечения.

Если итоговое сообщение содержит null или пустые скобки, рекомендуется выполнить следующие действия:

Проверка соответствия ключей Необходимо удостовериться, что переменные в шаблоне полностью идентичны ключам в объектах Data или заголовкам в DataFrame. Для верификации входящих параметров следует нажать Inspect output на компоненте, который выступает источником данных для Parser.
Анализ исходной информации Следует проверить входной конвейер на наличие пропусков или аномалий. Устранить несоответствия можно несколькими способами:
1. Внесение корректировок напрямую в источник данных.
2. Применение промежуточных узлов, таких как Data Operations, Structured Output или Smart Transform, для фильтрации данных перед их подачей в парсер.
Автоматическая очистка Активация параметра Clean Data (Очистка данных) в настройках самого компонента Parser позволяет системе автоматически игнорировать пустые ряды или некорректные строки.