В этой статье рассказывается, как извлечь текст из документа Word с помощью NET REST API. Вы научитесь автоматически извлекать текст из файла Word с помощью C# Low Code API, определяя начало и конец текста, который вы хотите получить из загруженного файла Word. Задать параметры диапазона можно различными способами, описанными в этой статье.
Обязательное условие
Скачать Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
Настройка проекта решения C# с помощью вышеуказанного SDK для сохранения диапазона в строке.
Действия по извлечению определенного текста из документа Word с помощью NET REST API
- Создайте объект класса WordsApi для извлечения диапазона текста из файла Word.
- Создайте экземпляр объекта GetRangeTextOnlineRequest и загрузите в него содержимое входного файла Word.
- Установите параметры диапазона в объекте запроса, чтобы определить начало и конец текстового диапазона.
- Вызовите метод GetRangeTextOnline, чтобы извлечь диапазон текста.
- Отображение текста из ответа, возвращаемого вызовом API
Вышеуказанные шаги описывают процесс извлечения текста из DOC с помощью C# Low Code API. Начните процесс, создав объект класса WordsApi, используя идентификатор и секрет клиента, и инициируйте объект запроса, используя класс GetRangeTextOnlineRequest. Заполните параметры, чтобы определить диапазон текста, и используйте их при вызове метода GetRangeTextOnline(), который извлекает данные из исходного файла.
Код для извлечения текста из DOCX с помощью C# REST API
using System.IO; | |
using Aspose.Words.Cloud.Sdk; | |
using Aspose.Words.Cloud.Sdk.Model; | |
using Aspose.Words.Cloud.Sdk.Model.Requests; | |
namespace WordsSample.Words | |
{ | |
public class WordFileOperations | |
{ | |
public void ExtractTextRange() | |
{ | |
var wordsApi = new WordsApi("client id", "client secret");// For fetching text | |
var request = new GetRangeTextOnlineRequest(); | |
request.Document = File.OpenRead("Sample.docx"); | |
request.RangeStartIdentifier = "page0"; | |
request.RangeEndIdentifier = "page0:end"; | |
var task = wordsApi.GetRangeTextOnline(request); | |
task.Wait(); | |
var result = task.Result; | |
System.Console.WriteLine(result.Text); | |
} | |
} | |
} |
Этот код демонстрирует как извлечь текст из документа Word с помощью C# REST API. GetRangeTextOnlineRequest содержит параметры RangeStartIdentifier и RangeEndIdentifier, которые можно использовать для установки диапазона текста, который вы хотите получить и сохранить в строковой переменной. Используйте идентификаторы диапазона, например, page3 показывает номер страницы 3, page3:end показывает конец страницы 3, а document:end показывает конец документа.
Эта статья научила нас определять диапазон текста на страницах и сохранять его в строковой переменной. Чтобы сохранить страницу в файле Word в изображении, обратитесь к следующей статье: Преобразование страницы Word в изображение с помощью NET REST API.