Questo breve tutorial spiega come estrarre testo da un documento PDF con Java REST API. Imparerai a estrarre testo da un PDF con un’API basata su Java utilizzando un Cloud SDK basato su Java. Dimostra il processo completo condividendo un codice di esempio per la lettura e la visualizzazione del testo del PDF.
Prerequisito
- Crea un account Credenziali API estrai il testo dal PDF
- Scarica Aspose.PDF Cloud SDK per Dotjava per leggere un file PDF
- Imposta il progetto Java con l’SDK sopra indicato per il recupero del testo
Passaggi per estrarre il testo PDF con l’API Java Low Code
- Configura PdfApi fornendo la chiave dell’applicazione e il SID per leggere il file PDF
- Carica il file PDF sorgente per estrarre il testo
- Chiamare il metodo Ottieni testo() dopo aver caricato correttamente il file PDF di origine
- Imposta l’area rettangolare della pagina da cui il testo deve essere recuperato su tutte le pagine
- Analizza tutte le occorrenze del testo nella risposta API e visualizza il testo
Questi passaggi implicano il processo di lettura del testo PDF con il servizio Java RESTful. Caricare il file PDF nell’archivio cloud e chiamare il metodo GetText() per recuperare tutte le occorrenze del testo da tutte le pagine del file PDF caricato, dal rettangolo specificato sulla pagina. Esaminare tutte le occorrenze nella risposta e visualizzare il numero di pagina e il testo.
Codice per acquisire testo da PDF con interfaccia Java REST
Questo codice illustra il processo per recuperare testo da un PDF con l’interfaccia Java REST. L’area rettangolare è costituita dalle posizioni x e y in basso a sinistra e x e y in alto a destra, all’interno delle quali si desidera recuperare il testo. Se è necessario recuperare testo da una singola pagina, utilizzare il metodo GetPageText(), che richiede un numero di pagina come argomento aggiuntivo per selezionare la pagina.
Questo articolo ci ha insegnato come leggere un file PDF senza utilizzare alcun software di lettura PDF installato sul sistema. Per contare il numero di parole in un file PDF, consulta l’articolo su Contare le parole in un documento PDF con Java REST API.