使用 NET REST API 从 Word 文档中提取文本

本文指导如何使用 NET REST API 从 Word 文档中提取文本。您将学习如何通过定义要从加载的 Word 文件中获取的文本的开始和结束来自动使用 C# Low Code API 从 Word 文件中提取文本。您可以按照本文中描述的各种方式设置范围参数。

先决条件

  • [创建账户并获取 API 凭证]( https://kb.aspose.cloud/ 总计/净/如何创建-aspose-cloud-apis 帐户/)

  • 下载 Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file

  • 使用上述 SDK 设置 C# 解决方案项目,用于将某个范围保存为字符串

使用 NET REST API 从 Word 文档中提取特定文本的步骤

  1. 创建 WordsApi 类对象以从 Word 文件中提取一定范围的文本
  2. 实例化GetRangeTextOnlineRequest对象并在其中加载输入的Word文件内容
  3. 设置请求对象中的范围参数来定义文本范围的开始和结束
  4. 调用 GetRangeTextOnline 方法提取文本范围
  5. 显示 API 调用返回的响应文本

上述步骤描述了使用 C# Low Code API 从 DOC 中提取文本的过程。通过使用客户端 ID 和密钥创建 WordsApi 类对象来开始该过程,并使用 GetRangeTextOnlineRequest 类启动请求对象。填写参数以定义文本范围,并在调用从源文件获取数据的 GetRangeTextOnline() 方法时使用它。

使用 C# REST API 从 DOCX 中提取文本的代码

此代码演示了如何使用 C# REST API 从 Word 文档中提取文本。GetRangeTextOnlineRequest 包含参数 RangeStartIdentifier 和 RangeEndIdentifier,可用于设置要获取并保存在字符串变量中的文本范围。使用范围标识符,例如 page3 显示第 3 页,page3:end 显示第 3 页的结尾,document:end 显示文档的结尾。

本文教我们如何定义跨页面的文本范围并将其保存在字符串变量中。要将 Word 文件中的页面保存为图像,请参阅以下文章:使用 NET REST API 将 Word 页面转换为图像

 简体中文