Извлечение текста из документа Word с помощью REST API Nodej.

В этой статье рассказывается, как извлечь текст из документа Word с помощью REST API Nodej. Вы научитесь автоматически извлекать текст из файла Word с помощью Low Code API Nodej, указав начало и конец текста, который нужно извлечь из загруженного файла Word. Вы можете задать параметры диапазона различными способами, описанными в этой статье.

Необходимое условие

Шаги по извлечению определенного текста из документа Word с помощью REST API Nodej.

  1. Создайте объект класса WordsApi для извлечения диапазона текста из файла Word.
  2. Создайте объект GetRangeTextOnlineRequest и загрузите в него содержимое входного файла Word.
  3. Установите параметры диапазона в объекте запроса, чтобы определить начало и конец текстового диапазона.
  4. Вызовите метод GetRangeTextOnline для извлечения диапазона текста.
  5. Отобразить текст из ответа, возвращенного вызовом API

Вышеописанные шаги описывают процесс извлечения текста из документа DOC с помощью Node.js Low Code API. Начните процесс с создания объекта класса WordsApi, используя идентификатор клиента и секретный код, и инициируйте объект запроса с помощью класса GetRangeTextOnlineRequest. Заполните параметры, чтобы определить диапазон текста, и используйте его при вызове метода GetRangeTextOnline(), который извлекает данные из исходного файла.

Код для извлечения текста из DOCX с помощью REST API Nodej.

Этот код демонстрирует, как извлечь текст из документа Word с помощью REST API Node.js. Запрос GetRangeTextOnlineRequest содержит параметры RangeStartIdentifier и RangeEndIdentifier, которые можно использовать для задания диапазона текста, который требуется извлечь и сохранить в строковой переменной. Используйте идентификаторы диапазонов, например, page3 для номера страницы 3, page3:end для конца страницы 3, а document:end для конца документа.

В этой статье мы узнали, как определить диапазон текста на страницах и сохранить его в строковой переменной. Чтобы сохранить страницу из файла Word в изображение, обратитесь к следующей статье: Преобразование страницы Word в изображение с помощью REST API Nodej..

 Русский