Извлечение страниц из Word с помощью Python REST API

В этой статье рассказывается, как извлечь страницы из Word с помощью Python REST API. Вы узнаете, как сохранять страницы в формате DOCX с помощью Python REST API, используя облачный SDK Python. Вы получите различные примеры идентификаторов для установки начала и конца диапазона при сохранении в новом файле Word.

Необходимое условие

Шаги по извлечению страницы из документа Word с помощью Python Low Code API

  1. Инициализируйте объект класса WordsApi для извлечения диапазона из файла Word.
  2. Создайте объект запроса, используя класс SaveAsRangeOnlineRequest, чтобы сохранить диапазон.
  3. Прочитать исходный файл Word в объект запроса
  4. Определите начало и конец диапазона для извлечения из загруженного файла Word.
  5. Извлечь диапазон с помощью метода SaveAsRangeOnline()
  6. Сохраните выходной файл Word, содержащий определенный диапазон содержимого.

Вышеприведенные шаги демонстрируют, как извлечь страницы из документа Word с помощью Python Low Code API. Начните процесс с создания объекта класса WordsApi и объекта запроса SaveAsRangeOnlineRequest, указав содержимое входного файла Word, идентификатор начала и конца диапазона, а также имя выходного файла Word. Вызовите метод SaveAsRangeOnline(), используя заданный объект запроса, и сохраните выходной файл Word, возвращенный в объекте ответа API.

Код для Word Page Extractor с Python REST API

Этот код демонстрирует, как сохранять страницы в формате DOC с помощью Python Low Code API. Вы можете задать начало и конец диапазона, используя идентификаторы, например, ‘page2’ устанавливает номер страницы 2, ‘page2:end устанавливает конец страницы 2, ‘document:end устанавливает конец документа, а ‘id0.0.0’ устанавливает путь к узлу. Эти идентификаторы помогают задать диапазон от любого узла в документе до любой нужной позиции в документе и сохранить вывод в отдельном файле Word.

Эта статья научила нас конвертировать страницы в Microsoft Word с помощью Python Low Code API. Если вы хотите извлечь метаданные из файла Word, обратитесь к следующей статье: Извлечение метаданных из документа Word с помощью Python REST API.

 Русский