Este breve tutorial explica cómo extraer texto de un documento PDF con la API REST de Node.js. Aprenderá a extraer texto de un PDF con una API basada en Node.js mediante un SDK de Cloud basado en Node.js. Demuestra el proceso completo compartiendo un código de ejemplo para leer y mostrar el texto del PDF.
Requisito previo
- Crear una cuenta con credenciales de API extraer texto del PDF
- Descargue SDK en la nube Aspose.PDF para Node.js para leer un archivo PDF
- Configurar el proyecto Node.js con el SDK anterior para obtener texto
Pasos para extraer texto PDF con la API Low Code de Node.js
- Configure PdfApi proporcionando la clave de aplicación y el SID para leer el archivo PDF
- Sube el archivo PDF de origen para extraer el texto
- Llame al método Obtener texto() después de cargar correctamente el archivo PDF de origen
- Establezca el área rectangular de la página desde la que se obtendrá el texto en todas las páginas
- Analizar todas las ocurrencias del texto en la respuesta de la API y mostrar el texto
Estos pasos implican el proceso de leer texto PDF con el servicio RESTful de Node.js. Cargue el archivo PDF en el almacenamiento en la nube y llame al método GetText() para obtener todas las ocurrencias del texto de todas las páginas del archivo PDF cargado desde el rectángulo especificado en la página. Revise todas las ocurrencias en la respuesta y muestre el número de página y el texto.
Código para extraer texto de un PDF con la interfaz REST de Node.js
Este código muestra el proceso para recuperar texto de un PDF con la interfaz REST de Node.js. El área rectangular consta de las posiciones x e y (inferior izquierda) y x e y (superior derecha) de las cuales se desea obtener el texto. Si necesita obtener texto de una sola página, utilice el método GetPageText(), que requiere un número de página como argumento adicional para seleccionarla.
Este artículo nos ha enseñado a leer archivos PDF sin tener instalado ningún programa de lectura de PDF. Si desea contar las palabras de un archivo PDF, consulte el artículo sobre Contar palabras en un documento PDF con la API REST de Node.js.