Izdvojite tekst iz PDF dokumenta pomoću C# REST API-ja

Ovaj kratki vodič objašnjava kako izdvojiti tekst iz PDF dokumenta pomoću C# REST API-ja. Naučit ćete izdvojiti tekst iz PDF-a pomoću API-ja temeljenog na C# .NET koristeći Cloud SDK temeljen na .NET. Demonstrira cijeli proces dijeljenjem uzorka koda za čitanje i prikazivanje PDF teksta.

Preduvjet

Koraci za izdvajanje PDF teksta s C# Low Code API-jem

  1. Konfigurirajte PdfApi dajući aplikacijski ključ i SID za čitanje PDF datoteke
  2. Učitajte izvornu PDF datoteku za izdvajanje teksta
  3. Pozovite metodu GetText() nakon uspješnog učitavanja izvorne PDF datoteke
  4. Postavite pravokutno područje stranice iz kojeg će se dohvatiti tekst na svim stranicama
  5. Raščlanite sva pojavljivanja teksta u API odgovoru i prikažite tekst

Ovi koraci podrazumijevaju postupak čitanja PDF teksta s C# RESTful uslugom. Učitajte PDF datoteku u pohranu u oblaku i pozovite metodu GetText() za dohvaćanje svih pojavljivanja teksta sa svih stranica učitane PDF datoteke iz navedenog pravokutnika na stranici. Pohvala kroz sva pojavljivanja u odgovoru i prikaz broja stranice i teksta.

Kod za preuzimanje teksta iz PDF-a s C# REST sučeljem

Ovaj kôd demonstrira proces dohvaćanja teksta iz PDF-a s C# REST sučeljem. Pravokutno područje sastoji se od donje lijeve x i y pozicije i gornje desne x i y pozicije unutar koje želite dohvatiti tekst. Ako trebate dohvatiti tekst s jedne stranice, upotrijebite metodu GetPageText() koja zahtijeva broj stranice kao dodatni argument za odabir stranice.

Ovaj nas je članak naučio čitati PDF datoteku bez korištenja softvera za čitanje PDF-a instaliranog na vašem sustavu. Ako želite izbrojati broj riječi u PDF datoteci, pogledajte članak na Brojite riječi u PDF dokumentu pomoću C# REST API-ja.

 Hrvatski