Витягніть текст із документа Word за допомогою NET REST API

У цій статті описано, як витягти текст із документа Word за допомогою NET REST API. Ви навчитеся автоматично витягувати текст із файлу Word за допомогою C# Low Code API, визначаючи початок і кінець тексту, який ви хочете отримати із завантаженого файлу Word. Ви можете встановити параметри діапазону різними способами, описаними в цій статті.

Обов’язкова умова

Кроки для вилучення певного тексту з документа Word за допомогою NET REST API

  1. Створіть об’єкт класу WordsApi, щоб отримати діапазон тексту з файлу Word
  2. Створіть об’єкт GetRangeTextOnlineRequest і завантажте в нього вміст вхідного файлу Word
  3. Встановіть параметри діапазону в об’єкті запиту, щоб визначити початок і кінець текстового діапазону
  4. Викличте метод GetRangeTextOnline, щоб отримати діапазон тексту
  5. Відображення тексту відповіді, яку повертає виклик API

Наведені вище кроки описують процес вилучення тексту з DOC за допомогою C# Low Code API. Розпочніть процес, створивши об’єкт класу WordsApi, використовуючи ідентифікатор клієнта та секрет, і ініціюйте об’єкт запиту, використовуючи клас GetRangeTextOnlineRequest. Заповніть параметри, щоб визначити діапазон тексту, і використовуйте його під час виклику методу GetRangeTextOnline(), який отримує дані з вихідного файлу.

Код для вилучення тексту з DOCX за допомогою C# REST API

using System.IO;
using Aspose.Words.Cloud.Sdk;
using Aspose.Words.Cloud.Sdk.Model;
using Aspose.Words.Cloud.Sdk.Model.Requests;
namespace WordsSample.Words
{
public class WordFileOperations
{
public void ExtractTextRange()
{
var wordsApi = new WordsApi("client id", "client secret");// For fetching text
var request = new GetRangeTextOnlineRequest();
request.Document = File.OpenRead("Sample.docx");
request.RangeStartIdentifier = "page0";
request.RangeEndIdentifier = "page0:end";
var task = wordsApi.GetRangeTextOnline(request);
task.Wait();
var result = task.Result;
System.Console.WriteLine(result.Text);
}
}
}

This code demonstrates how to extract text from Word document with C# REST API. The GetRangeTextOnlineRequest contains the parameters RangeStartIdentifier and RangeEndIdentifier that can be used to set the range of text that you want to fetch and save in a string variable. Use range identifiers such as page3 shows page number 3, page3:end shows the end of page 3, and document:end shows the end of the document.

Ця стаття навчила нас, як визначити діапазон тексту на сторінках і зберегти його в рядковій змінній. Щоб зберегти сторінку у файлі Word на зображенні, перегляньте таку статтю: Перетворення сторінки Word на зображення за допомогою NET REST API.

 Українська