Այս կարճ ձեռնարկը բացատրում է, թե ինչպես արտահանել տեքստ PDF փաստաթղթից Node.js REST API-ով: Դուք կսովորեք արտահանել տեքստ PDF-ից Node.js-ի վրա հիմնված API՝ օգտագործելով Node.js-ի վրա հիմնված Cloud SDK-ն: Այն ցույց է տալիս ամբողջական գործընթացը՝ կիսելով PDF տեքստը կարդալու և ցուցադրելու օրինակելի կոդը:
Նախապայման
- Ստեղծեք հաշվի API հավատարմագրեր հանել տեքստը PDF-ից
- Ներբեռնեք Aspose.PDF Cloud SDK Node.js-ի համար՝ PDF ֆայլը կարդալու համար
- Տեղադրեք Node.js նախագիծը վերը նշված SDK-ով տեքստը բեռնելու համար
Node.js Low Code API-ով PDF տեքստը հանելու քայլեր
- Կարգավորեք PdfApi-ը՝ տրամադրելով հավելվածի բանալին և SID՝ PDF ֆայլը կարդալու համար
- Վերբեռնեք սկզբնաղբյուր PDF ֆայլը տեքստը հանելու համար
- Աղբյուրի PDF ֆայլը հաջող վերբեռնելուց հետո զանգահարեք GetText () մեթոդը
- Սահմանեք էջի ուղղանկյուն տարածքը, որտեղից պետք է բեռնվի տեքստը բոլոր էջերում
- Վերլուծեք API-ի պատասխանում տեքստի բոլոր երևույթները և ցուցադրեք տեքստը
Այս քայլերը ենթադրում են * PDF տեքստը Node.js RESTful Service*-ի միջոցով կարդալու գործընթացը: Բեռնեք PDF ֆայլը Cloud պահեստում և զանգահարեք GetText() մեթոդը՝ բեռնված PDF ֆայլի բոլոր էջերից տեքստի բոլոր երևույթները էջի նշված ուղղանկյունից վերցնելու համար: Գովեք պատասխանի բոլոր երևույթների միջոցով և ցուցադրեք էջի համարը և տեքստը:
Կոդ՝ Node.js REST ինտերֆեյսի միջոցով PDF-ից տեքստ վերցնելու համար
Այս կոդը ցույց է տալիս Node.js REST ինտերֆեյսի միջոցով * PDF-ից տեքստը առբերելու գործընթացը: Ուղղանկյուն տարածքը բաղկացած է ներքևի ձախից x և y դիրքից և վերին աջից x և y դիրքից, որի ներսում ցանկանում եք բեռնել տեքստը: Եթե Ձեզ անհրաժեշտ է տեքստ վերցնել մեկ էջից, օգտագործեք GetPageText() մեթոդը, որը պահանջում է էջի համարը որպես լրացուցիչ փաստարկ՝ էջն ընտրելու համար:
Այս հոդվածը մեզ սովորեցրել է կարդալ PDF ֆայլը առանց ձեր համակարգում տեղադրված PDF ընթերցման ծրագրերի օգտագործման: Եթե ցանկանում եք հաշվել PDF ֆայլի բառերի քանակը, տես Հաշվեք բառերը PDF փաստաթղթում Node.js REST API-ով-ի հոդվածը: