Bài viết này hướng dẫn cách trích xuất văn bản từ tài liệu Word bằng NET REST API. Bạn sẽ học cách tự động trích xuất văn bản từ tệp Word bằng API mã thấp C# bằng cách xác định phần đầu và phần cuối của văn bản bạn muốn tìm nạp từ tệp Word đã tải. Bạn có thể đặt tham số phạm vi theo nhiều cách khác nhau được mô tả trong bài viết này.
Điều kiện tiên quyết
Tải xuống Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
Thiết lập dự án giải pháp C# với SDK ở trên để lưu một phạm vi vào một chuỗi
Các bước để trích xuất văn bản cụ thể từ tài liệu Word bằng NET REST API
- Tạo đối tượng lớp WordsApi để trích xuất một loạt văn bản từ tệp Word
- Khởi tạo đối tượng GetRangeTextOnlineRequest và tải nội dung tệp Word đầu vào trong đó
- Đặt tham số phạm vi trong đối tượng yêu cầu để xác định điểm bắt đầu và kết thúc của phạm vi văn bản
- Gọi phương thức GetRangeTextOnline để trích xuất phạm vi văn bản
- Hiển thị văn bản từ phản hồi được trả về bởi lệnh gọi API
Các bước trên mô tả quy trình trích xuất văn bản từ DOC bằng API mã thấp C#. Bắt đầu quá trình bằng cách tạo đối tượng lớp WordsApi bằng cách sử dụng ID khách hàng và bí mật, đồng thời khởi tạo đối tượng yêu cầu bằng cách sử dụng lớp GetRangeTextOnlineRequest. Điền các tham số để xác định phạm vi văn bản và sử dụng nó trong khi gọi phương thức GetRangeTextOnline() để tìm nạp dữ liệu từ tệp nguồn.
Mã để trích xuất văn bản từ DOCX bằng API C# REST
Mã này trình bày cách trích xuất văn bản từ tài liệu Word bằng API C# REST. GetRangeTextOnlineRequest chứa các tham số RangeStartIdentifier và RangeEndIdentifier có thể được sử dụng để đặt phạm vi văn bản mà bạn muốn tìm nạp và lưu trong một biến chuỗi. Sử dụng các mã định danh phạm vi như page3 hiển thị số trang 3, page3:end hiển thị phần cuối của trang 3 và document:end hiển thị phần cuối của tài liệu.
Bài viết này đã dạy chúng ta cách xác định một phạm vi văn bản trên các trang và lưu nó vào một biến chuỗi. Để lưu một trang trong file Word thành hình ảnh, hãy tham khảo bài viết sau: Chuyển đổi trang Word thành hình ảnh bằng API NET REST.