Bài viết này hướng dẫn cách tách tệp Word bằng Python REST API. Bạn sẽ tìm hiểu quy trình tự động trích xuất các trang từ Word bằng Python REST API sử dụng Python cloud SDK. Chúng ta sẽ thảo luận về các tham số khác nhau để tùy chỉnh đầu ra của quy trình tách.
Điều kiện tiên quyết
- {{Siêu liên kết1}}
- Tải xuống Aspose.Words Cloud SDK dành cho Python để chia nhỏ tệp Word
- Thiết lập dự án giải pháp Python với SDK ở trên để trích xuất các trang
Các bước để chia nhỏ tài liệu Word bằng Python Low Code API
- Khởi tạo một đối tượng của lớp WordsApi để chia nhỏ tệp Word
- Tải tệp Word vào đối tượng luồng tệp
- Tạo đối tượng SplitDocumentOnlineRequest với tệp đầu vào, tệp đầu ra và phạm vi trang
- Gọi đối tượng SplitDocumentOnline bằng cách sử dụng đối tượng yêu cầu ở trên
- Lấy trang đầu ra mục tiêu bằng phương thức Result.Document.TryGetValue() và lưu nó vào đĩa
Các bước này mô tả cách chia tách Word DOC bằng Python REST API. Bắt đầu quá trình bằng cách tải tệp Word nguồn, sau đó tạo đối tượng SplitDocumentOnlineRequest bằng cách cung cấp tài liệu đầu vào, định dạng đầu ra, tên tệp đầu ra, trang bắt đầu và trang kết thúc. Cuối cùng, gọi phương thức SplitDocumentOnline để chia tách tài liệu và lưu trang đầu ra mong muốn trên đĩa.
Mã cho Trình chia tách tài liệu Word trực tuyến bằng Python Low Code API
Mã này minh họa quy trình trích xuất các trang từ tài liệu Word bằng Python Low Code API. Tên tệp đích được sử dụng làm tiền tố cho nhiều trang đầu ra, trong đó ‘_page#’ được sử dụng làm hậu tố. Mã này tạo ra số lượng tên được trích xuất từ tài liệu nguồn bằng cách sử dụng lược đồ này và có thể được truy xuất như minh họa trong mã mẫu, trong đó trang 2 được lưu trên đĩa.
Trong chủ đề này, chúng ta đã học cách phát triển bộ tách DOCX bằng Python REST API. Để ghép các tệp Word, hãy tham khảo bài viết sau: Hợp nhất các tài liệu Word với Python REST API.