Ištraukite tekstą iš Word dokumento naudodami Python REST API

Šiame straipsnyje paaiškinama, kaip ištraukti tekstą iš Word dokumento naudojant Python REST API. Išmoksite automatiškai išskleisti tekstą iš Word failo naudodami Python Low Code API, nustatydami teksto, kurį norite gauti iš įkelto Word failo, pradžią ir pabaigą. Diapazono parametrus galite nustatyti įvairiais šiame straipsnyje aprašytais būdais.

Būtina sąlyga

Veiksmai, kaip ištraukti konkretų tekstą iš Word dokumento naudojant Python REST API

  1. Sukurkite WordsApi klasės objektą, kad ištrauktumėte teksto diapazoną iš Word failo
  2. Sukurkite objektą GetRangeTextOnlineRequest ir į jį įkelkite įvesties Word failo turinį
  3. Norėdami apibrėžti teksto diapazono pradžią ir pabaigą, užklausos objekte nustatykite diapazono parametrus
  4. Iškvieskite metodą GetRangeTextOnline, kad ištrauktumėte teksto diapazoną
  5. Rodyti tekstą iš atsakymo, kurį grąžino API iškvietimas

Pirmiau pateikti veiksmai aprašo teksto išskleidimo iš DOC naudojant Python Low Code API procesą. Pradėkite procesą sukurdami WordsApi klasės objektą naudodami kliento ID ir paslaptį, ir inicijuokite užklausos objektą naudodami GetRangeTextOnlineRequest klasę. Įveskite parametrus, kad apibrėžtumėte teksto diapazoną, ir naudokite jį iškvietę GetRangeTextOnline() metodą, kuris gauna duomenis iš šaltinio failo.

Kodas, skirtas ištraukti tekstą iš DOCX naudojant Python REST API

Šis kodas parodo kaip išgauti tekstą iš Word dokumento naudojant Python REST API. GetRangeTextOnlineRequest yra parametrai RangeStartIdentifier ir RangeEndIdentifier, kuriuos galima naudoti norint nustatyti teksto diapazoną, kurį norite gauti ir išsaugoti eilutės kintamajame. Naudoti diapazono identifikatorius, pvz., page3 rodo 3 puslapio numerį, page3:end rodo 3 puslapio pabaigą, o document:end rodo dokumento pabaigą.

Šis straipsnis mus išmokė, kaip apibrėžti teksto diapazoną puslapiuose ir išsaugoti jį eilutės kintamajame. Norėdami išsaugoti puslapį Word faile kaip vaizdą, žr. šį straipsnį: Konvertuokite Word puslapį į vaizdą naudodami Python REST API.

 Latviski