Tento krátký tutoriál vysvětluje, jak extrahovat text z dokumentu PDF pomocí C# REST API. Naučíte se extrahovat text z PDF pomocí C# .NET-based API pomocí .NET-based Cloud SDK. Demonstruje celý proces sdílením ukázkového kódu pro čtení a zobrazení textu PDF.

Předpoklad

Vytvořte přihlašovací údaje API účtu extrahovat text z PDF
Stáhnout Aspose.PDF Cloud SDK for Dotnet to read a PDF file
Nastavte projekt C# s výše uvedenou sadou SDK pro načítání textu

Kroky k extrahování textu PDF pomocí C# Low Code API

Nakonfigurujte PdfApi zadáním aplikačního klíče a SID pro čtení souboru PDF
Nahrajte zdrojový soubor PDF pro extrahování textu
Po úspěšném nahrání zdrojového souboru PDF zavolejte metodu GetText()
Nastavte obdélníkovou oblast stránky, ze které má být načten text na všech stránkách
Analyzujte všechny výskyty textu v odpovědi API a zobrazte text

Tyto kroky zahrnují proces čtení textu PDF pomocí C# RESTful Service. Načtěte soubor PDF do cloudového úložiště a zavolejte metodu GetText() k načtení všech výskytů textu ze všech stránek v načteném souboru PDF ze zadaného obdélníku na stránce. Pochvalte všechny výskyty v odpovědi a zobrazte číslo stránky a text.

Kód pro uchopení textu z PDF pomocí rozhraní C# REST

Tento kód demonstruje proces načtení textu z PDF pomocí C# REST Interface. Obdélníková oblast se skládá z levé spodní pozice x a y az pravé horní pozice x a y, ve které chcete načíst text. Pokud potřebujete načíst text z jedné stránky, použijte metodu GetPageText(), která vyžaduje číslo stránky jako další argument pro výběr stránky.

Tento článek nás naučil číst soubor PDF bez použití jakéhokoli softwaru pro čtení PDF nainstalovaného ve vašem systému. Pokud chcete spočítat počet slov v souboru PDF, přečtěte si článek na Počítejte slova v dokumentu PDF pomocí C# REST API.

Aspose.cloud Znalostní báze

Najít odpovědi pomocí API

Extrahujte text z dokumentu PDF pomocí C# REST API

Kroky k extrahování textu PDF pomocí C# Low Code API

Kód pro uchopení textu z PDF pomocí rozhraní C# REST