使用 Python REST API 从 Word 中提取页面

本文将指导您如何使用 Python REST API 从 Word 中提取页面。您将学习如何使用 Python 云 SDK 将页面保存为 DOCX 文件。您将获得各种标识符示例,用于设置保存为新 Word 文件的范围的起始和终止。

先决条件

使用 Python Low Code API 从 Word 文档中提取页面的步骤

  1. 初始化 WordsApi 类对象以从 Word 文件中提取范围
  2. 使用 SaveAsRangeOnlineRequest 类创建请求对象来保存范围
  3. 将源 Word 文件读入请求对象
  4. 定义从加载的 Word 文件中提取的范围的开始和结束
  5. 使用 在线保存范围() 方法提取范围
  6. 保存包含定义内容范围的输出 Word 文件

以上步骤介绍了如何使用 Python Low Code API 从 Word 文档中提取页面。首先创建 WordsApi 类对象,然后通过设置输入 Word 文件内容、范围起始标识符、结束标识符和输出 Word 文件名来创建 SaveAsRangeOnlineRequest 请求对象。使用定义的请求对象调用 SaveAsRangeOnline() 方法,并保存 API 响应对象中返回的输出 Word 文件。

使用 Python REST API 的 Word 页面提取器代码

此代码演示了如何使用 Python Low Code API 将页面保存为 DOC。您可以使用标识符设置范围的起始和结束,例如page2”设置页码 2,page2:end 设置页码 2 的结束位置,document:end 设置文档的结束位置,以及id0.0.0”设置节点路径。这些标识符有助于设置从文档中任意节点到文档中任意所需位置的范围,并将输出保存到单独的 Word 文件中。

本文教我们如何使用 Python Low Code API 将页面转换为 Microsoft Word 格式。如果您想从 Word 文件中提取元数据,请参阅以下文章:使用 Python REST API 从 Word 文档中提取元数据

 简体中文