Чтение таблицы

Eng: Get table PDF

Элемент предназначен для автоматического извлечения табличных данных из PDF-документов. Он обеспечивает быстрый и точный способ чтения таблиц со страниц PDF, что особенно полезно при обработке большого количества документов или при интеграции данных из PDF в другие системы и приложения.

Чтобы элемент стал доступен в Студии, необходимо установить библиотеку Primo.Office.Pdf либо обновить ее до версии 1.1.0

Свойства

Символ * указывает на обязательность заполнения свойства. Описание общих свойств см. здесь.

PDF:

  1. Путь к файлу [String] — путь к PDF-файлу, из которого необходимо извлечь таблицу.

  2. Пароль [String] — пароль для доступа к защищенному PDF-документу.

  3. Защищенный пароль [SecureString] — безопасный способ предоставления пароля для доступа к PDF-документу.

  4. Страница [Int32] — номер страницы PDF-документа, на которой находится таблица. Нумерация начинается с нуля.

  5. Индекс [Int32] — индекс таблицы на странице, если страница содержит несколько таблиц. Нумерация начинается с нуля.

  6. Заголовки — указывает на наличие заголовков в таблице.

  7. Ядро — ядро для обработки PDF-файла. Выбор ядра осуществляется на ваше усмотрение, в зависимости от получаемого результата. Доступные значения:

    • Spire — значение по умолчанию. Это компонент для обработки PDF-файлов без установки Adobe Acrobat. Не имеет ограничений к количеству страниц в документе. Данный компонент позволяет извлекать формы, изображения, текст, страницы и вложения из PDF-документа с высокой скоростью и точностью.

    • Aspose — компонент для обработки и анализа PDF-файлов без установки Adobe Acrobat. Также позволяет работать со страницами, формами, текстом, изображениями, шрифтами, закладками, водяными знаками, подписями и т.д. Имеет ограничение: документ должен быть не более 3-х страниц.

Вывод:

  1. Переменная [DataTable] — переменная для хранения данных, извлеченных из таблицы PDF-документа.

Решение проблем

При работе с активностью по извлечению таблиц из PDF-документов могут возникнуть следующие ошибки:

  1. Ошибка чтения файла: Если путь к файлу указан неверно или файл не доступен, может возникнуть ошибка чтения файла. Важно убедиться, что путь к файлу корректен и файл доступен для чтения.

  2. Проблемы с паролем: Если PDF-файл защищен паролем, неправильный пароль может вызвать ошибку доступа. Убедитесь, что пароль правильный и корректно передается в компонент.

Пример использования

Пример использования элемента в процессе с типом Только код (Pure code):

Primo.Office.Pdf.PdfApp.GetTable(wf, , "Путь к файлу", "Индекс", "Страница", "Заголовки", "Пароль");

Last updated