Tento krátký tutoriál vysvětluje, jak extrahovat text z dokumentu PDF pomocí C# REST API. Naučíte se extrahovat text z PDF pomocí C# .NET-based API pomocí .NET-based Cloud SDK. Demonstruje celý proces sdílením ukázkového kódu pro čtení a zobrazení textu PDF.
Předpoklad
Vytvořte přihlašovací údaje API účtu extrahovat text z PDF
Stáhnout Aspose.PDF Cloud SDK for Dotnet to read a PDF file
Nastavte projekt C# s výše uvedenou sadou SDK pro načítání textu
Kroky k extrahování textu PDF pomocí C# Low Code API
- Nakonfigurujte PdfApi zadáním aplikačního klíče a SID pro čtení souboru PDF
- Nahrajte zdrojový soubor PDF pro extrahování textu
- Po úspěšném nahrání zdrojového souboru PDF zavolejte metodu GetText()
- Nastavte obdélníkovou oblast stránky, ze které má být načten text na všech stránkách
- Analyzujte všechny výskyty textu v odpovědi API a zobrazte text
Tyto kroky zahrnují proces čtení textu PDF pomocí C# RESTful Service. Načtěte soubor PDF do cloudového úložiště a zavolejte metodu GetText() k načtení všech výskytů textu ze všech stránek v načteném souboru PDF ze zadaného obdélníku na stránce. Pochvalte všechny výskyty v odpovědi a zobrazte číslo stránky a text.
Kód pro uchopení textu z PDF pomocí rozhraní C# REST
Tento kód demonstruje proces načtení textu z PDF pomocí C# REST Interface. Obdélníková oblast se skládá z levé spodní pozice x a y az pravé horní pozice x a y, ve které chcete načíst text. Pokud potřebujete načíst text z jedné stránky, použijte metodu GetPageText(), která vyžaduje číslo stránky jako další argument pro výběr stránky.
Tento článek nás naučil číst soubor PDF bez použití jakéhokoli softwaru pro čtení PDF nainstalovaného ve vašem systému. Pokud chcete spočítat počet slov v souboru PDF, přečtěte si článek na Počítejte slova v dokumentu PDF pomocí C# REST API.