Trích xuất các trang từ Word bằng Python REST API

Bài viết này hướng dẫn cách trích xuất trang từ Word bằng Python REST API. Bạn sẽ học cách lưu trang dưới dạng DOCX bằng Python REST API bằng Python Cloud SDK. Bạn sẽ nhận được nhiều mẫu định danh khác nhau để thiết lập điểm bắt đầu và kết thúc của phạm vi lưu dưới dạng tệp Word mới.

Điều kiện tiên quyết

  • {{Siêu liên kết1}}
  • Tải xuống Aspose.Words Cloud SDK dành cho Python để trích xuất một phạm vi từ tệp Word
  • Thiết lập dự án giải pháp Python với SDK ở trên để lưu phạm vi vào tệp Word

Các bước trích xuất trang từ tài liệu Word bằng Python Low Code API

  1. Khởi tạo đối tượng lớp WordsApi để trích xuất phạm vi từ tệp Word
  2. Tạo một đối tượng yêu cầu bằng cách sử dụng lớp SaveAsRangeOnlineRequest để lưu một phạm vi
  3. Đọc tệp Word nguồn vào đối tượng yêu cầu
  4. Xác định điểm bắt đầu và kết thúc của phạm vi cần trích xuất từ ​​tệp Word đã tải
  5. Trích xuất phạm vi bằng phương pháp Lưu dưới dạng phạm vi trực tuyến()
  6. Lưu tệp Word đầu ra có chứa phạm vi nội dung đã xác định

Các bước trên trình bày cách trích xuất các trang từ tài liệu Word bằng Python Low Code API. Bắt đầu quy trình bằng cách tạo đối tượng lớp WordsApi và đối tượng yêu cầu SaveAsRangeOnlineRequest bằng cách thiết lập nội dung tệp Word đầu vào, định danh bắt đầu phạm vi, định danh kết thúc và tên tệp Word đầu ra. Gọi phương thức SaveAsRangeOnline() bằng cách sử dụng đối tượng yêu cầu đã xác định và lưu tệp Word đầu ra được trả về trong đối tượng phản hồi API.

Mã cho Word Page Extractor với Python REST API

Mã này minh họa cách lưu trang dưới dạng DOC với Python Low Code API. Bạn có thể thiết lập phạm vi bắt đầu và kết thúc bằng cách sử dụng mã định danh như ‘page2’ đặt số trang là 2, page2:end đặt kết thúc trang là 2, document:end đặt kết thúc tài liệu, và ‘id0.0.0’ đặt đường dẫn nút. Các mã định danh này giúp thiết lập phạm vi từ bất kỳ nút nào trong tài liệu đến bất kỳ vị trí mong muốn nào trong tài liệu và lưu kết quả đầu ra vào một tệp Word riêng biệt.

Bài viết này hướng dẫn chúng ta cách chuyển đổi các trang sang Microsoft Word bằng Python Low Code API. Nếu bạn muốn trích xuất siêu dữ liệu từ tệp Word, hãy tham khảo bài viết sau: Trích xuất siêu dữ liệu từ tài liệu Word bằng Python REST API.

 Tiếng Việt