Estrarre testo da un documento Word con l'API REST di Nodej

Questo articolo spiega come estrarre testo da un documento Word con l’API REST di Nodej. Imparerai a estrarre automaticamente testo da un file Word con l’API Low Code di Nodej definendo l’inizio e la fine del testo che desideri estrarre dal file Word caricato. Puoi impostare i parametri di intervallo nei vari modi descritti in questo articolo.

Prerequisito

Passaggi per estrarre testo specifico da un documento Word con l’API REST di Nodej

  1. Crea l’oggetto classe WordsApi per estrarre un intervallo di testo da un file Word
  2. Crea un’istanza dell’oggetto GetRangeTextOnlineRequest e carica il contenuto del file Word di input al suo interno
  3. Imposta i parametri di intervallo nell’oggetto di richiesta per definire l’inizio e la fine dell’intervallo di testo
  4. Chiama il metodo Ottieni intervallo testo online per estrarre l’intervallo di testo
  5. Visualizza il testo della risposta restituita dalla chiamata API

I passaggi precedenti descrivono il processo per estrarre testo da DOC con l’API Low Code di Nodej. Inizia il processo creando l’oggetto classe WordsApi utilizzando l’ID client e il segreto, e avvia l’oggetto richiesta utilizzando la classe GetRangeTextOnlineRequest. Inserisci i parametri per definire l’intervallo di testo e utilizzalo durante la chiamata al metodo GetRangeTextOnline() che recupera i dati dal file sorgente.

Codice per estrarre testo da DOCX con l’API REST di Nodej

Questo codice mostra come estrarre testo da un documento Word con l’API REST di Nodej. La richiesta GetRangeTextOnlineRequest contiene i parametri RangeStartIdentifier e RangeEndIdentifier, che possono essere utilizzati per impostare l’intervallo di testo che si desidera recuperare e salvare in una variabile stringa. Utilizzare identificatori di intervallo come page3 per visualizzare la pagina numero 3, page3:end per visualizzare la fine della pagina 3 e document:end per visualizzare la fine del documento.

Questo articolo ci ha insegnato come definire un intervallo di testo tra le pagine e salvarlo in una variabile stringa. Per salvare una pagina di un file Word in un’immagine, fare riferimento al seguente articolo: Convertire una pagina Word in un’immagine con l’API REST di Nodej.

 Italiano