Витягніть текст із PDF-документа за допомогою C# REST API

У цьому короткому посібнику пояснюється, як витягнути текст із документа PDF за допомогою C# REST API. Ви навчитеся видобувати текст із PDF-файлу за допомогою C# .NET API за допомогою Cloud SDK на основі .NET. Він демонструє повний процес, надсилаючи зразок коду для читання та відображення тексту PDF.

Обов’язкова умова

Кроки для вилучення тексту PDF за допомогою C# Low Code API

  1. Налаштуйте PdfApi, надавши ключ програми та SID для читання файлу PDF
  2. Завантажте вихідний PDF-файл для вилучення тексту
  3. Викличте метод GetText() після успішного завантаження вихідного файлу PDF
  4. Встановіть прямокутну область сторінки, з якої буде отримано текст на всіх сторінках
  5. Проаналізуйте всі входження тексту у відповідь API та відобразіть текст

Ці кроки передбачають процес читання тексту PDF за допомогою C# RESTful Service. Завантажте PDF-файл у хмарне сховище та викличте метод GetText(), щоб отримати всі входження тексту з усіх сторінок завантаженого PDF-файлу з указаного прямокутника на сторінці. Хваліть через усі випадки у відповіді та відображайте номер сторінки та текст.

Код для отримання тексту з PDF за допомогою інтерфейсу C# REST

Цей код демонструє процес отримання тексту з PDF за допомогою інтерфейсу C# REST. Прямокутна область складається з нижньої лівої позиції x і y і верхньої правої позиції x і y, у межах якої ви хочете отримати текст. Якщо вам потрібно отримати текст з однієї сторінки, скористайтеся методом GetPageText(), який вимагає номер сторінки як додатковий аргумент для вибору сторінки.

Ця стаття навчила нас читати файл PDF без використання будь-якого програмного забезпечення для читання PDF, встановленого у вашій системі. Якщо ви хочете підрахувати кількість слів у файлі PDF, зверніться до статті Підраховуйте слова в документі PDF за допомогою C# REST API.

 Українська