Քաղեք տեքստ Word փաստաթղթից Python REST API-ով

Այս հոդվածը ցույց է տալիս, թե ինչպես արտահանել տեքստ Word փաստաթղթից Python REST API-ով: Դուք կսովորեք ավտոմատ կերպով արտահանել տեքստ Word ֆայլից Python Low Code API-ով՝ սահմանելով տեքստի սկիզբը և վերջը, որը ցանկանում եք վերցնել բեռնված Word ֆայլից: Դուք կարող եք սահմանել միջակայքի պարամետրերը այս հոդվածում նկարագրված տարբեր ձևերով:

Նախապայման

Python REST API-ով Word փաստաթղթից կոնկրետ տեքստ հանելու քայլեր

  1. Ստեղծեք WordsApi դասի օբյեկտ՝ Word ֆայլից մի շարք տեքստեր հանելու համար
  2. Տեղադրեք GetRangeTextOnlineRequest օբյեկտը և բեռնեք մուտքագրված Word ֆայլի բովանդակությունը դրանում
  3. Սահմանեք տիրույթի պարամետրերը հարցումի օբյեկտում՝ տեքստի տիրույթի սկիզբն ու վերջը սահմանելու համար
  4. Տեքստի տիրույթը հանելու համար զանգահարեք GetRangeTextOnline մեթոդը
  5. Ցուցադրել տեքստը API-ի զանգով վերադարձված պատասխանից

Վերոնշյալ քայլերը նկարագրում են DOC-ից տեքստ հանելու գործընթացը Python Low Code API-ով: Սկսեք գործընթացը՝ ստեղծելով WordsApi դասի օբյեկտ՝ օգտագործելով հաճախորդի ID-ն և գաղտնիքը, և գործարկեք հարցումի օբյեկտը՝ օգտագործելով GetRangeTextOnlineRequest դասը: Լրացրեք պարամետրերը՝ տեքստի տիրույթը սահմանելու համար և օգտագործեք այն՝ կանչելիս GetRangeTextOnline() մեթոդը, որը տվյալներ է բերում աղբյուրի ֆայլից:

Կոդ՝ DOCX-ից Python REST API-ով տեքստ հանելու համար

Այս կոդը ցույց է տալիս ինչպես հանել տեքստը Word փաստաթղթից Python REST API-ով: GetRangeTextOnlineRequest-ը պարունակում է RangeStartIdentifier և RangeEndIdentifier պարամետրերը, որոնք կարող են օգտագործվել տեքստի տիրույթը սահմանելու համար, որը ցանկանում եք վերցնել և պահպանել տողային փոփոխականում: Օգտագործեք միջակայքի նույնացուցիչներ, ինչպիսիք են՝ page3-ը ցույց է տալիս էջի համարը 3, page3:end-ը ցույց է տալիս 3-րդ էջի վերջը, իսկ document:end ցույց է տալիս փաստաթղթի վերջը:

Այս հոդվածը մեզ սովորեցրել է, թե ինչպես սահմանել տեքստի տիրույթ էջերում և պահպանել այն տողային փոփոխականում: Word ֆայլի էջը պատկերի մեջ պահելու համար տես հետևյալ հոդվածը՝ Փոխակերպեք Word էջը պատկերի Python REST API-ի միջոցով:

 Հայերեն