Чтение таблицы PDF
Eng: Get table PDF
Элемент предназначен для автоматического извлечения табличных данных из PDF-документов. Он обеспечивает быстрый и точный способ чтения таблиц со страниц PDF, что особенно полезно при обработке большого количества документов или при интеграции данных из PDF в другие системы и приложения.
Чтобы элемент стал доступен в Студии, необходимо установить библиотеку Primo.Office.Pdf либо обновить ее до версии 1.1.0
Свойства
Символ *
указывает на обязательность заполнения свойства. Описание общих свойств см. здесь.
PDF:
- Путь к файлу [String] — путь к PDF-файлу, из которого необходимо извлечь таблицу.
- Пароль [String] — пароль для доступа к защищенному PDF-документу.
- Защищенный пароль [SecureString] — безопасный способ предоставления пароля для доступа к PDF-документу.
- Страница [Int32] — номер страницы PDF-документа, на которой находится таблица. Нумерация начинается с нуля.
- Индекс [Int32] — индекс таблицы на странице, если страница содержит несколько таблиц. Нумерация начинается с нуля.
- Заголовки — указывает на наличие заголовков в таблице.
- Ядро — ядро для обработки PDF-файла. Выбор ядра осуществляется на ваше усмотрение, в зависимости от получаемого результата. Доступные значения:
- Spire — значение по умолчанию. Это компонент для обработки PDF-файлов без установки Adobe Acrobat. Не имеет ограничений к количеству страниц в документе. Данный компонент позволяет извлекать формы, изображения, текст, страницы и вложения из PDF-документа с высокой скоростью и точностью.
- Aspose — компонент для обработки и анализа PDF-файлов без установки Adobe Acrobat. Также позволяет работать со страницами, формами, текстом, изображениями, шрифтами, закладками, водяными знаками, подписями и т.д. Имеет ограничение: документ должен быть не более 3-х страниц.
Вывод:
- Переменная [DataTable] — переменная для хранения данных, извлеченных из таблицы PDF-документа.
Решение проблем
При работе с активностью по извлечению таблиц из PDF-документов могут возникнуть следующие ошибки:
- Ошибка чтения файла: Если путь к файлу указан неверно или файл не доступен, может возникнуть ошибка чтения файла. Важно убедиться, что путь к файлу корректен и файл доступен для чтения.
- Проблемы с паролем: Если PDF-файл защищен паролем, неправильный пароль может вызвать ошибку доступа. Убедитесь, что пароль правильный и корректно передается в компонент.
Только код
Пример использования элемента в процессе с типом Только код (Pure code):
C#
Primo.Office.Pdf.PdfApp.GetTable(wf, , "Путь к файлу", "Индекс", "Страница", "Заголовки", "Пароль");