Estrarre testo da un documento PDF con l'API REST di Node.js

Questo breve tutorial spiega come estrarre testo da un documento PDF con l’API REST di Node.js. Imparerai a estrarre testo da un PDF con l’API basata su Node.js utilizzando un Cloud SDK basato su Node.js. Dimostra il processo completo condividendo un codice di esempio per la lettura e la visualizzazione del testo del PDF.

Prerequisito

Passaggi per estrarre il testo PDF con l’API Node.js Low Code

  1. Configura PdfApi fornendo la chiave dell’applicazione e il SID per leggere il file PDF
  2. Carica il file PDF sorgente per estrarre il testo
  3. Chiamare il metodo Ottieni testo() dopo aver caricato correttamente il file PDF di origine
  4. Imposta l’area rettangolare della pagina da cui il testo deve essere recuperato su tutte le pagine
  5. Analizza tutte le occorrenze del testo nella risposta API e visualizza il testo

Questi passaggi implicano il processo di lettura del testo PDF con il servizio RESTful di Node.js. Caricare il file PDF nell’archivio cloud e chiamare il metodo GetText() per recuperare tutte le occorrenze del testo da tutte le pagine del file PDF caricato, dal rettangolo specificato sulla pagina. Esaminare tutte le occorrenze nella risposta e visualizzare il numero di pagina e il testo.

Codice per acquisire testo da PDF con interfaccia REST Node.js

Questo codice illustra il processo per recuperare testo da un PDF con l’interfaccia REST di Node.js. L’area rettangolare è costituita dalle posizioni x e y in basso a sinistra e x e y in alto a destra, all’interno delle quali si desidera recuperare il testo. Se è necessario recuperare il testo da una singola pagina, utilizzare il metodo GetPageText(), che richiede un numero di pagina come argomento aggiuntivo per selezionare la pagina.

Questo articolo ci ha insegnato come leggere un file PDF senza utilizzare alcun software di lettura PDF installato sul sistema. Per contare il numero di parole in un file PDF, consulta l’articolo su Conta le parole in un documento PDF con l’API REST di Node.js.

 Italiano