Extraer texto de un documento de Word con la API REST de Nodejs

Este artículo explica cómo extraer texto de un documento Word con la API REST de Nodej. Aprenderá a extraer texto automáticamente de un archivo de Word con la API Low Code de Nodej. Definiendo el inicio y el final del texto que desea obtener del archivo de Word cargado. Puede configurar los parámetros de rango de varias maneras, como se describe en este artículo.

Requisito previo

  • {{HIPERVÍNCULO1}}
  • Descargue SDK de Aspose.Words Cloud para Node.js para extraer un rango de texto de un archivo de Word
  • Configurar el proyecto de solución Nodej.s con el SDK anterior para guardar un rango en una cadena

Pasos para extraer texto específico de un documento de Word con la API REST de Nodejs

  1. Cree el objeto de clase WordsApi para extraer un rango de texto de un archivo de Word
  2. Cree una instancia del objeto GetRangeTextOnlineRequest y cargue en él el contenido del archivo Word de entrada
  3. Establezca los parámetros de rango en el objeto de solicitud para definir el inicio y el final del rango de texto
  4. Llame al método ObtenerTextoDeRangoEnLínea para extraer el rango de texto
  5. Mostrar el texto de la respuesta devuelta por la llamada API

Los pasos anteriores describen el proceso para extraer texto de un documento DOC con la API Low Code de Nodej. Para comenzar, cree el objeto de la clase WordsApi con el ID y el secreto del cliente, e inicie el objeto de solicitud con la clase GetRangeTextOnlineRequest. Complete los parámetros para definir el rango de texto y úselo al llamar al método GetRangeTextOnline(), que obtiene datos del archivo fuente.

Código para extraer texto de DOCX con la API REST de Nodejs

Este código demuestra cómo extraer texto de un documento de Word con la API REST de Nodej. La solicitud GetRangeTextOnlineRequest contiene los parámetros RangeStartIdentifier y RangeEndIdentifier, que permiten establecer el rango de texto que se desea recuperar y guardar en una variable de cadena. Utilice identificadores de rango como page3 para la página número 3, page3:end para el final de la página 3 y document:end para el final del documento.

Este artículo nos enseñó a definir un rango de texto en las páginas y guardarlo en una variable de cadena. Para guardar una página de un archivo de Word como imagen, consulte el siguiente artículo: Convertir una página de Word en una imagen con la API REST de Nodejs.

 Español