Trích xuất hình ảnh từ PDF bằng Node.js REST API

Hướng dẫn nhanh này sẽ hướng dẫn bạn cách trích xuất ảnh từ PDF bằng Node.js REST API. Hướng dẫn có đầy đủ chi tiết để thiết lập môi trường phát triển, danh sách các bước để phát triển trình chuyển đổi và trích xuất ảnh từ PDF bằng Giao diện REST Node.js sử dụng Cloud SDK dựa trên Node.js. Bạn sẽ học cách trích xuất ảnh từ một trang hoặc tất cả các trang trong PDF.

Điều kiện tiên quyết

Các bước trích xuất hình ảnh từ PDF bằng API dựa trên Node.js

  1. Cấu hình đối tượng PdfApi bằng cách thiết lập Khóa API và SID ứng dụng để trích xuất hình ảnh
  2. Tải tệp PDF gốc có hình ảnh lên bộ nhớ đám mây
  3. Gọi phương thức Lấy hình ảnh() với tên tệp PDF đã tải lên và số trang đích
  4. Phân tích tất cả hình ảnh trong danh sách và lấy ID hình ảnh
  5. Đối với mỗi hình ảnh, hãy gọi phương thức GetImageExtractAsJpeg() với tên và ID hình ảnh để tải xuống hình ảnh
  6. Lưu hình ảnh với tên duy nhất trên đĩa

Các bước sau đây tóm tắt cách trích xuất hình ảnh từ PDF bằng Node.js Low Code API. Tạo đối tượng PdfApi, tải tệp PDF nguồn lên bằng PdfApi và lấy danh sách hình ảnh trong tệp PDF nguồn bằng phương thức GetImages(). Lặp lại danh sách để lấy ID hình ảnh và sử dụng phương thức GetImageExtractAsJpeg() để lấy hình ảnh và lưu vào ổ đĩa.

Mã để trích xuất hình ảnh từ PDF bằng dịch vụ RESTful của Node.js

Mã này minh họa cách xuất hình ảnh từ PDF bằng Node.js Low Code API. Mã này sẽ lấy hình ảnh từ một trang duy nhất, tuy nhiên bạn có thể lặp lại tất cả các trang trong PDF và lấy tất cả hoặc một số hình ảnh đã chọn từ trang đó dựa trên chỉ mục hình ảnh. Bạn có thể đặt tên duy nhất cho hình ảnh đã tải xuống bằng cách sử dụng số trang và chỉ mục hình ảnh.

Bài viết này hướng dẫn chúng ta cách trích xuất hình ảnh từ tệp PDF. Nếu bạn muốn chèn hình ảnh vào tệp PDF, hãy tham khảo bài viết trên Chèn hình ảnh vào PDF bằng Node.js REST API.

 Tiếng Việt