Քաղեք տեքստ PDF փաստաթղթից Node.js REST API-ով

Այս կարճ ձեռնարկը բացատրում է, թե ինչպես արտահանել տեքստ PDF փաստաթղթից Node.js REST API-ով: Դուք կսովորեք արտահանել տեքստ PDF-ից Node.js-ի վրա հիմնված API՝ օգտագործելով Node.js-ի վրա հիմնված Cloud SDK-ն: Այն ցույց է տալիս ամբողջական գործընթացը՝ կիսելով PDF տեքստը կարդալու և ցուցադրելու օրինակելի կոդը:

Նախապայման

Node.js Low Code API-ով PDF տեքստը հանելու քայլեր

  1. Կարգավորեք PdfApi-ը՝ տրամադրելով հավելվածի բանալին և SID՝ PDF ֆայլը կարդալու համար
  2. Վերբեռնեք սկզբնաղբյուր PDF ֆայլը տեքստը հանելու համար
  3. Աղբյուրի PDF ֆայլը հաջող վերբեռնելուց հետո զանգահարեք GetText () մեթոդը
  4. Սահմանեք էջի ուղղանկյուն տարածքը, որտեղից պետք է բեռնվի տեքստը բոլոր էջերում
  5. Վերլուծեք API-ի պատասխանում տեքստի բոլոր երևույթները և ցուցադրեք տեքստը

Այս քայլերը ենթադրում են * PDF տեքստը Node.js RESTful Service*-ի միջոցով կարդալու գործընթացը: Բեռնեք PDF ֆայլը Cloud պահեստում և զանգահարեք GetText() մեթոդը՝ բեռնված PDF ֆայլի բոլոր էջերից տեքստի բոլոր երևույթները էջի նշված ուղղանկյունից վերցնելու համար: Գովեք պատասխանի բոլոր երևույթների միջոցով և ցուցադրեք էջի համարը և տեքստը:

Կոդ՝ Node.js REST ինտերֆեյսի միջոցով PDF-ից տեքստ վերցնելու համար

Այս կոդը ցույց է տալիս Node.js REST ինտերֆեյսի միջոցով * PDF-ից տեքստը առբերելու գործընթացը: Ուղղանկյուն տարածքը բաղկացած է ներքևի ձախից x և y դիրքից և վերին աջից x և y դիրքից, որի ներսում ցանկանում եք բեռնել տեքստը: Եթե ​​Ձեզ անհրաժեշտ է տեքստ վերցնել մեկ էջից, օգտագործեք GetPageText() մեթոդը, որը պահանջում է էջի համարը որպես լրացուցիչ փաստարկ՝ էջն ընտրելու համար:

Այս հոդվածը մեզ սովորեցրել է կարդալ PDF ֆայլը առանց ձեր համակարգում տեղադրված PDF ընթերցման ծրագրերի օգտագործման: Եթե ​​ցանկանում եք հաշվել PDF ֆայլի բառերի քանակը, տես Հաշվեք բառերը PDF փաստաթղթում Node.js REST API-ով-ի հոդվածը:

 Հայերեն