Витягніть текст із документа Word за допомогою NET REST API

У цій статті описано, як витягти текст із документа Word за допомогою NET REST API. Ви навчитеся автоматично витягувати текст із файлу Word за допомогою C# Low Code API, визначаючи початок і кінець тексту, який ви хочете отримати із завантаженого файлу Word. Ви можете встановити параметри діапазону різними способами, описаними в цій статті.

Обов’язкова умова

Кроки для вилучення певного тексту з документа Word за допомогою NET REST API

  1. Створіть об’єкт класу WordsApi, щоб отримати діапазон тексту з файлу Word
  2. Створіть об’єкт GetRangeTextOnlineRequest і завантажте в нього вміст вхідного файлу Word
  3. Встановіть параметри діапазону в об’єкті запиту, щоб визначити початок і кінець текстового діапазону
  4. Викличте метод GetRangeTextOnline, щоб отримати діапазон тексту
  5. Відображення тексту відповіді, яку повертає виклик API

Наведені вище кроки описують процес вилучення тексту з DOC за допомогою C# Low Code API. Розпочніть процес, створивши об’єкт класу WordsApi, використовуючи ідентифікатор клієнта та секрет, і ініціюйте об’єкт запиту, використовуючи клас GetRangeTextOnlineRequest. Заповніть параметри, щоб визначити діапазон тексту, і використовуйте його під час виклику методу GetRangeTextOnline(), який отримує дані з вихідного файлу.

Код для вилучення тексту з DOCX за допомогою C# REST API

This code demonstrates how to extract text from Word document with C# REST API. The GetRangeTextOnlineRequest contains the parameters RangeStartIdentifier and RangeEndIdentifier that can be used to set the range of text that you want to fetch and save in a string variable. Use range identifiers such as page3 shows page number 3, page3:end shows the end of page 3, and document:end shows the end of the document.

Ця стаття навчила нас, як визначити діапазон тексту на сторінках і зберегти його в рядковій змінній. Щоб зберегти сторінку у файлі Word на зображенні, перегляньте таку статтю: Перетворення сторінки Word на зображення за допомогою NET REST API.

 Українська