Šioje trumpoje pamokoje paaiškinama, kaip ištraukti tekstą iš PDF dokumento naudojant Node.js REST API. Išmoksite ištraukti tekstą iš PDF naudodami Node.js pagrįstą API naudodami Node.js pagrįstą debesies SDK. Jame demonstruojamas visas procesas, bendrinant pavyzdinį kodą, skirtą skaityti ir rodyti PDF tekstą.
Būtina sąlyga
- Sukurkite paskyros API kredencialus ištraukite tekstą iš PDF
- Atsisiųskite Aspose.PDF debesies SDK, skirta Node.js ir skaitykite PDF failą
- Nustatykite Node.js projektą naudodami anksčiau pateiktą SDK, kad gautumėte tekstą
Veiksmai, kaip ištraukti PDF tekstą naudojant Node.js Low Code API
- Konfigūruokite PdfApi pateikdami programos raktą ir SID, kad galėtumėte skaityti PDF failą
- Įkelkite šaltinio PDF failą, kad ištrauktumėte tekstą
- Sėkmingai įkėlus šaltinio PDF failą, iškvieskite metodą Gauti tekstą ()
- Nustatykite stačiakampę puslapio sritį, iš kurios turi būti paimtas tekstas visuose puslapiuose
- Išnagrinėkite visus API atsakymo teksto atvejus ir parodykite tekstą
Šie veiksmai apima * PDF teksto skaitymo naudojant Node.js RESTful Service* procesą. Įkelkite PDF failą į debesies saugyklą ir iškvieskite GetText() metodą, kad gautumėte visus teksto atvejus iš visų įkelto PDF failo puslapių iš nurodyto puslapio stačiakampio. Pagirkite visus atsakymų atvejus ir parodykite puslapio numerį bei tekstą.
Kodas, skirtas paimti tekstą iš PDF su Node.js REST sąsaja
Šis kodas parodo, kaip gauti tekstą iš PDF naudojant Node.js REST sąsają. Stačiakampę sritį sudaro apatinė kairioji x ir y padėtis bei viršutinė dešinė x ir y padėtis, kurioje norite gauti tekstą. Jei reikia gauti tekstą iš vieno puslapio, naudokite GetPageText() metodą, kuriam norint pasirinkti puslapį reikalingas puslapio numeris kaip papildomas argumentas.
Šis straipsnis mus išmokė skaityti PDF failą nenaudojant jokios jūsų sistemoje įdiegtos PDF skaitymo programinės įrangos. Jei norite suskaičiuoti žodžių skaičių PDF faile, žr. straipsnį apie Suskaičiuokite žodžius PDF dokumente naudodami Node.js REST API.