Denna korta handledning förklarar hur man extraherar text från PDF dokument med C# REST API. Du kommer att lära dig att extrahera text ur PDF med C# .NET-baserat API med en .NET-baserad Cloud SDK. Den visar hela processen genom att dela en exempelkod för att läsa och visa PDF-texten.
Nödvändig förutsättning
Skapa API-uppgifter för ett konto extrahera text från PDF
Ladda ner Aspose.PDF Cloud SDK for Dotnet to read a PDF file
Ställ in C#-projekt med ovanstående SDK för att hämta text
Steg för att extrahera PDF-text med C# Low Code API
- Konfigurera PdfApi genom att tillhandahålla programnyckeln och SID för att läsa PDF-filen
- Ladda upp käll-PDF-filen för att extrahera texten
- Anropa metoden GetText() när käll-PDF-filen har laddats upp
- Ställ in det rektangulära området på sidan som text ska hämtas från på alla sidor
- Analysera alla förekomster av texten i API-svaret och visa texten
Dessa steg innebär processen att läsa PDF-text med C# RESTful Service. Ladda PDF-filen till molnlagringen och anrop GetText()-metoden för att hämta alla förekomster av texten från alla sidor i den inlästa PDF-filen från den angivna rektangeln på sidan. Beröm genom alla händelser i svaret och visa sidnummer och text.
Kod för att hämta text från PDF med C# REST-gränssnitt
Den här koden demonstrerar processen för att hämta text från PDF med C# REST Interface. Det rektangulära området består av den nedre vänstra x- och y-positionen och den övre högra x- och y-positionen inom vilken du vill hämta texten. Om du behöver hämta text från en enda sida, använd metoden GetPageText() som kräver ett sidnummer som ett ytterligare argument för att välja sidan.
Den här artikeln har lärt oss att läsa PDF-filen utan att använda någon PDF-läsmjukvara installerad på ditt system. Om du vill räkna antalet ord i en PDF-fil, se artikeln om Räkna ord i PDF-dokument med C# REST API.