Чтение таблицы

Get table

Элемент предназначен для автоматического извлечения табличных данных из PDF-документов. Он обеспечивает быстрый и точный способ чтения таблиц со страниц PDF, что особенно полезно при обработке большого количества документов или при интеграции данных из PDF в другие системы и приложения.

Чтобы элемент стал доступен в Студии, необходимо установить NuGet-пакет Primo.Office.Pdf.Linux. Данный пакет совместим только со Студией версии 1.24.8 и выше.

Свойства

Символ * указывает на обязательность заполнения свойства. Описание общих свойств см. здесь.

PDF:

  1. Путь к файлу [String] — путь к PDF-файлу, из которого необходимо извлечь таблицу. Пример: "/home/astra/folder/test.pdf".

  2. Пароль [String] — пароль для доступа к защищенному PDF-документу.

  3. Защищенный пароль [SecureString] — безопасный способ предоставления пароля к PDF-документу.

  4. Индекс страницы [Int32] — номер страницы PDF-документа, на которой находится искомая таблица. На индекс страницы влияет тип выбранного ядра:

    • если выбрано ядро Aspose, то индексация начинается с 1.

    • если выбрано ядро Spire, то индексация начинается с 0.

  5. Индекс таблицы [Int32] — номер таблицы на странице, если таблиц несколько. Нумерация начинается с 0.

  6. Ядро — ядро для обработки PDF-файла. Выбор ядра осуществляется на ваше усмотрение. Доступные значения:

    • Spire — значение по умолчанию. Компонент для обработки PDF-файлов без установки Adobe Acrobat. Данный компонент позволяет извлекать формы, изображения, текст, страницы и вложения из PDF-документа с высокой скоростью и точностью. Имеет ограничение: документ должен быть не более 3-х страниц.

    • Aspose — компонент для обработки и анализа PDF-файлов без установки Adobe Acrobat. Также позволяет работать со страницами, формами, текстом, изображениями, шрифтами, закладками, водяными знаками, подписями и т.д. Не имеет ограничений к количеству страниц в документе.

  7. Заголовки [Boolean] — определяет, содержит ли таблица заголовки. По умолчанию заголовки отключены.

Вывод:

  1. Переменная [DataTable] — название переменной для хранения извлеченных табличных данных.

Last updated