Trích xuất hình ảnh từ PDF bằng Java REST API

Hướng dẫn nhanh này hướng dẫn bạn cách trích xuất ảnh từ PDF bằng Java REST API. Hướng dẫn bao gồm tất cả thông tin chi tiết để thiết lập môi trường phát triển, danh sách các bước để phát triển trình chuyển đổi và trích xuất ảnh từ PDF bằng Giao diện Java REST bằng Cloud SDK dựa trên Java. Bạn sẽ học cách trích xuất ảnh từ một trang hoặc tất cả các trang trong PDF.

Điều kiện tiên quyết

Các bước trích xuất hình ảnh từ PDF bằng Java API

  1. Cấu hình đối tượng PdfApi bằng cách thiết lập Khóa API và SID ứng dụng để trích xuất hình ảnh
  2. Tải tệp PDF gốc có hình ảnh lên bộ nhớ đám mây
  3. Gọi phương thức Lấy hình ảnh() với tên tệp PDF đã tải lên và số trang đích
  4. Phân tích tất cả hình ảnh trong danh sách và lấy ID hình ảnh
  5. Đối với mỗi hình ảnh, hãy gọi phương thức GetImageExtractAsJpeg() với tên và ID hình ảnh để tải xuống hình ảnh
  6. Lưu hình ảnh với tên duy nhất trên đĩa

Các bước sau đây tóm tắt cách trích xuất hình ảnh từ PDF bằng Java Low Code API. Tạo đối tượng PdfApi, tải tệp PDF nguồn lên bằng PdfApi và lấy danh sách hình ảnh trong tệp PDF nguồn bằng phương thức GetImages(). Lặp lại danh sách để lấy ID hình ảnh và sử dụng phương thức GetImageExtractAsJpeg() để lấy hình ảnh và lưu vào ổ đĩa.

Mã để trích xuất hình ảnh từ PDF bằng dịch vụ RESTful Java

Mã này minh họa cách xuất hình ảnh từ PDF bằng Java Low Code API. Mã này lấy hình ảnh từ một trang duy nhất, tuy nhiên bạn có thể lặp lại tất cả các trang trong PDF và lấy tất cả hoặc một số hình ảnh đã chọn từ trang đó dựa trên chỉ mục hình ảnh. Bạn có thể đặt tên duy nhất cho hình ảnh đã tải xuống bằng cách sử dụng số trang và chỉ mục hình ảnh.

Bài viết này hướng dẫn chúng ta cách trích xuất hình ảnh từ tệp PDF. Nếu bạn muốn chèn hình ảnh vào tệp PDF, hãy tham khảo bài viết trên Chèn hình ảnh vào PDF bằng Java REST API.

 Tiếng Việt