Đếm số từ trong tài liệu PDF bằng Java REST API

Hướng dẫn ngắn này hướng dẫn cách đếm số từ trong tài liệu PDF bằng Java REST API. Bạn sẽ học cách tự động đếm số từ trong tệp PDF bằng Java REST API bằng Cloud SDK dựa trên Java. Không cần cài đặt bất kỳ công cụ nào của bên thứ ba để đếm từ trong PDF.

Điều kiện tiên quyết

Các bước đếm từ trên PDF bằng giao diện Java REST

  1. Khởi tạo PdfApi bằng cách sử dụng ID khách hàng và bí mật để đếm từ
  2. Tải tệp PDF nguồn có tên lên bộ lưu trữ đám mây để xử lý
  3. Gọi phương thức GetWordsPerPage() bằng tệp PDF nguồn đã tải lên
  4. Phân tích phản hồi API và sử dụng Danh sách trong đối tượng WordsPerPage
  5. Hiển thị số trang và số từ trên đó từ danh sách

Các bước này mô tả cách phát triển một ứng dụng Đếm từ PDF bằng API mã Java thấp. Tải tệp PDF nguồn vào luồng bộ nhớ, tải tệp đó lên bộ lưu trữ đám mây với một tên cụ thể và gọi phương thức GetWordsPerPage() cho tệp này. Cuối cùng, phân tích cú pháp phản hồi API và lặp qua các mục trong WordsPerPage.List để hiển thị số từ trên mỗi trang.

Mã để đếm số từ trong PDF bằng Java Low Code API

import com.aspose.pdf.cloud.sdk.ApiException;
import com.aspose.pdf.cloud.sdk.Configuration;
import com.aspose.pdf.cloud.sdk.api.PdfApi;
import com.aspose.pdf.cloud.sdk.model.FileUploadResponse;
import com.aspose.pdf.cloud.sdk.model.WordCountResponse;
import com.aspose.pdf.cloud.sdk.model.PageWordCount;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
public class PdfTasks {
public static void countWords() throws ApiException, IOException {
String clientId = "ClientID";
String clientSecret = "ClientSecret";
Configuration configuration = new Configuration(clientId, clientSecret);
PdfApi pdfApi = new PdfApi(configuration);
String fileName = "sample.pdf";
String storage = "";
String folder = "";
try {
// Upload the PDF file to Aspose Cloud storage
File pdfFile = new File(fileName);
try (FileInputStream fileInputStream = new FileInputStream(pdfFile)) {
FileUploadResponse uploadResult = pdfApi.uploadFile(fileName, fileInputStream);
System.out.println("File uploaded: " + uploadResult.getStatus());
}
// Get words count per page from the PDF document
WordCountResponse apiResponse = pdfApi.getWordsPerPage(fileName, storage, folder);
if (apiResponse != null && apiResponse.getStatus().equals("OK")) {
for (PageWordCount pageWordCount : apiResponse.getWordsPerPage().getList()) {
System.out.println("Page Number: " + pageWordCount.getPageNumber() +
" | Total Words: " + pageWordCount.getCount());
}
}
} catch (ApiException | IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
try {
countWords();
} catch (ApiException | IOException e) {
e.printStackTrace();
}
}
}

Mã này trình bày cách lấy đếm từ trên tài liệu PDF bằng API dựa trên Java. Bạn có thể đặt tên bộ nhớ trong khi tải tệp PDF lên và sử dụng cùng tên đó khi gọi GetWordsPerPage() để tham chiếu đến tệp PDF đã tải lên. Tải tệp PDF đầu vào từ đĩa hoặc một số nguồn khác như cơ sở dữ liệu hoặc bất kỳ luồng bộ nhớ nào khác.

Bài viết này đã hướng dẫn chúng tôi lấy số từ từ PDF bằng Giao diện Java REST. Nếu bạn muốn tạo một tệp PDF có thể điền, hãy tham khảo bài viết sau: Tạo một tệp PDF có thể điền bằng Java REST API.

 Tiếng Việt