Contar palabras en un documento PDF con la API REST de Java

Este breve tutorial guía cómo contar palabras en un documento PDF con la API REST de Java. Aprenderá a contar palabras en un archivo PDF automáticamente con la API REST de Java utilizando el SDK de nube basado en Java. No es necesario instalar ninguna herramienta de terceros para contar palabras en el PDF.

Requisito previo

Pasos para contar palabras en PDF con la interfaz REST de Java

  1. Cree una instancia de PdfApi utilizando el ID del cliente y el secreto para contar palabras.
  2. Cargue el archivo PDF de origen con el nombre en el almacenamiento en la nube para procesarlo
  3. Llame al método GetWordsPerPage() utilizando el archivo PDF fuente cargado
  4. Analice la respuesta de la API y use la Lista en el objeto WordsPerPage
  5. Muestra el número de página y el número de palabras de la lista.

Estos pasos describen cómo desarrollar una aplicación para recuento de palabras PDF con Java Low Code API. Cargue el archivo PDF de origen en la secuencia de memoria, cárguelo en el almacenamiento en la nube con un nombre específico y llame al método GetWordsPerPage() para este archivo. Finalmente, analice la respuesta de la API y repita los elementos en WordsPerPage.List para mostrar la cantidad de palabras por página.

Código para contar el número de palabras en PDF con Java Low Code API

import com.aspose.pdf.cloud.sdk.ApiException;
import com.aspose.pdf.cloud.sdk.Configuration;
import com.aspose.pdf.cloud.sdk.api.PdfApi;
import com.aspose.pdf.cloud.sdk.model.FileUploadResponse;
import com.aspose.pdf.cloud.sdk.model.WordCountResponse;
import com.aspose.pdf.cloud.sdk.model.PageWordCount;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
public class PdfTasks {
public static void countWords() throws ApiException, IOException {
String clientId = "ClientID";
String clientSecret = "ClientSecret";
Configuration configuration = new Configuration(clientId, clientSecret);
PdfApi pdfApi = new PdfApi(configuration);
String fileName = "sample.pdf";
String storage = "";
String folder = "";
try {
// Upload the PDF file to Aspose Cloud storage
File pdfFile = new File(fileName);
try (FileInputStream fileInputStream = new FileInputStream(pdfFile)) {
FileUploadResponse uploadResult = pdfApi.uploadFile(fileName, fileInputStream);
System.out.println("File uploaded: " + uploadResult.getStatus());
}
// Get words count per page from the PDF document
WordCountResponse apiResponse = pdfApi.getWordsPerPage(fileName, storage, folder);
if (apiResponse != null && apiResponse.getStatus().equals("OK")) {
for (PageWordCount pageWordCount : apiResponse.getWordsPerPage().getList()) {
System.out.println("Page Number: " + pageWordCount.getPageNumber() +
" | Total Words: " + pageWordCount.getCount());
}
}
} catch (ApiException | IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
try {
countWords();
} catch (ApiException | IOException e) {
e.printStackTrace();
}
}
}

Este código demuestra cómo obtener recuento de palabras en un documento PDF con API basada en Java. Puede configurar el nombre de almacenamiento mientras carga el archivo PDF y usar el mismo nombre al llamar a GetWordsPerPage() para hacer referencia al archivo PDF cargado. Cargue el archivo PDF de entrada desde el disco o alguna otra fuente, como una base de datos o cualquier otro flujo de memoria.

Este artículo nos ha guiado para obtener el recuento de palabras de un PDF con la interfaz REST de Java. Si desea crear un PDF rellenable, consulte el siguiente artículo: Cree un PDF rellenable con la API REST de Java.

 Español