Извлечение текста из документа Word с помощью NET REST API

В этой статье рассказывается, как извлечь текст из документа Word с помощью NET REST API. Вы научитесь автоматически извлекать текст из файла Word с помощью C# Low Code API, определяя начало и конец текста, который вы хотите получить из загруженного файла Word. Задать параметры диапазона можно различными способами, описанными в этой статье.

Обязательное условие

Действия по извлечению определенного текста из документа Word с помощью NET REST API

  1. Создайте объект класса WordsApi для извлечения диапазона текста из файла Word.
  2. Создайте экземпляр объекта GetRangeTextOnlineRequest и загрузите в него содержимое входного файла Word.
  3. Установите параметры диапазона в объекте запроса, чтобы определить начало и конец текстового диапазона.
  4. Вызовите метод GetRangeTextOnline, чтобы извлечь диапазон текста.
  5. Отображение текста из ответа, возвращаемого вызовом API

Вышеуказанные шаги описывают процесс извлечения текста из DOC с помощью C# Low Code API. Начните процесс, создав объект класса WordsApi, используя идентификатор и секрет клиента, и инициируйте объект запроса, используя класс GetRangeTextOnlineRequest. Заполните параметры, чтобы определить диапазон текста, и используйте их при вызове метода GetRangeTextOnline(), который извлекает данные из исходного файла.

Код для извлечения текста из DOCX с помощью C# REST API

Этот код демонстрирует как извлечь текст из документа Word с помощью C# REST API. GetRangeTextOnlineRequest содержит параметры RangeStartIdentifier и RangeEndIdentifier, которые можно использовать для установки диапазона текста, который вы хотите получить и сохранить в строковой переменной. Используйте идентификаторы диапазона, например, page3 показывает номер страницы 3, page3:end показывает конец страницы 3, а document:end показывает конец документа.

Эта статья научила нас определять диапазон текста на страницах и сохранять его в строковой переменной. Чтобы сохранить страницу в файле Word в изображении, обратитесь к следующей статье: Преобразование страницы Word в изображение с помощью NET REST API.

 Русский