Ovaj kratki vodič objašnjava kako izdvojiti tekst iz PDF dokumenta s Node.js REST API. Naučit ćete izdvojiti tekst iz PDF-a pomoću API-ja temeljenog na Node.js koristeći Cloud SDK temeljen na Node.js. Demonstrira cijeli proces dijeljenjem uzorka koda za čitanje i prikazivanje PDF teksta.
Preduvjet
- Stvorite API vjerodajnice računa izdvajanje teksta iz PDF-a
- Preuzmite Aspose.PDF Cloud SDK za Node.js za čitanje PDF datoteke
- Postavite Node.js projekt s gornjim SDK-om za dohvaćanje teksta
Koraci za izdvajanje PDF teksta s Node.js Low Code API-jem
- Konfigurirajte PdfApi dajući aplikacijski ključ i SID za čitanje PDF datoteke
- Učitajte izvornu PDF datoteku za izdvajanje teksta
- Pozovite metodu GetText() nakon uspješnog učitavanja izvorne PDF datoteke
- Postavite pravokutno područje stranice iz kojeg će se dohvatiti tekst na svim stranicama
- Raščlanite sva pojavljivanja teksta u API odgovoru i prikažite tekst
Ovi koraci podrazumijevaju postupak čitanja PDF teksta s Node.js RESTful Service. Učitajte PDF datoteku u pohranu u oblaku i pozovite metodu GetText() za dohvaćanje svih pojavljivanja teksta sa svih stranica učitane PDF datoteke iz navedenog pravokutnika na stranici. Pohvala kroz sva pojavljivanja u odgovoru i prikaz broja stranice i teksta.
Kod za preuzimanje teksta iz PDF-a s Node.js REST sučeljem
Ovaj kôd demonstrira proces dohvaćanja teksta iz PDF-a s Node.js REST sučeljem. Pravokutno područje sastoji se od donje lijeve x i y pozicije i gornje desne x i y pozicije unutar koje želite dohvatiti tekst. Ako trebate dohvatiti tekst s jedne stranice, upotrijebite metodu GetPageText() koja zahtijeva broj stranice kao dodatni argument za odabir stranice.
Ovaj nas je članak naučio čitati PDF datoteku bez korištenja softvera za čitanje PDF-a instaliranog na vašem sustavu. Ako želite izbrojati broj riječi u PDF datoteci, pogledajte članak Brojite riječi u PDF dokumentu pomoću Node.js REST API-ja.