Questo breve tutorial spiega come estrarre testo da un documento PDF con C# REST API. Imparerai a estrarre testo da un PDF con C# .NET-based API utilizzando un Cloud SDK basato su .NET. Dimostra il processo completo condividendo un codice di esempio per leggere e visualizzare il testo PDF.
Prerequisito
Crea credenziali API dell’account estrai il testo dal PDF
Scaricamento Aspose.PDF Cloud SDK for Dotnet to read a PDF file
Imposta il progetto C# con l’SDK sopra per il recupero del testo
Passaggi per estrarre il testo PDF con l’API C# Low Code
- Configura PdfApi fornendo la chiave dell’applicazione e il SID per leggere il file PDF
- Carica il file PDF di origine per estrarre il testo
- Chiama il metodo GetText() dopo aver caricato correttamente il file PDF di origine
- Imposta l’area rettangolare della pagina da cui deve essere prelevato il testo su tutte le pagine
- Analizza tutte le occorrenze del testo nella risposta API e visualizza il testo
Questi passaggi comportano il processo di lettura del testo PDF con il servizio RESTful C#. Carica il file PDF nell’archiviazione Cloud e chiama il metodo GetText() per recuperare tutte le occorrenze del testo da tutte le pagine nel file PDF caricato dal rettangolo specificato sulla pagina. Elogia tutte le occorrenze nella risposta e visualizza il numero di pagina e il testo.
Codice per acquisire testo da PDF con interfaccia C# REST
Questo codice illustra il processo per recuperare testo da PDF con interfaccia C# REST. L’area rettangolare è composta dalle posizioni x e y in basso a sinistra e dalle posizioni x e y in alto a destra entro cui si desidera recuperare il testo. Se si desidera recuperare testo da una singola pagina, utilizzare il metodo GetPageText() che richiede un numero di pagina come argomento aggiuntivo per selezionare la pagina.
Questo articolo ci ha insegnato a leggere il file PDF senza usare alcun software di lettura PDF installato sul tuo sistema. Se vuoi contare il numero di parole in un file PDF, fai riferimento all’articolo su Contare le parole in un documento PDF con C# REST API.