Extrahujte stránky z Wordu pomocí Python REST API

Tento článek popisuje, jak extrahovat stránky z Word pomocí Python REST API. Naučíte se jak ukládat stránky jako DOCX s Python REST API pomocí cloudové sady Python. Různé vzory identifikátorů pro nastavení začátku a konce rozsahu pro úsporu získáte jako nový soubor Word.

Předpoklad

Kroky k extrahování stránky z dokumentu Word pomocí Python Low Code API

  1. Inicializujte objekt třídy WordsApi a extrahujte rozsah ze souboru aplikace Word
  2. Chcete-li uložit rozsah, vytvořte objekt požadavku pomocí třídy SaveAsRangeOnlineRequest
  3. Načtěte zdrojový soubor aplikace Word do objektu požadavku
  4. Definujte začátek a konec rozsahu, který se má extrahovat z načteného souboru aplikace Word
  5. Extrahujte rozsah pomocí metody SaveAsRangeOnline()
  6. Uložte výstupní soubor aplikace Word obsahující definovaný rozsah obsahu

Výše uvedené kroky představují jak extrahovat stránky z dokumentu Word pomocí Python Low Code API. Začněte proces vytvořením objektu třídy WordsApi a objektu požadavku SaveAsRangeOnlineRequest nastavením obsahu vstupního souboru aplikace Word, identifikátoru začátku rozsahu, identifikátoru konce a názvu výstupního souboru aplikace Word. Zavolejte metodu SaveAsRangeOnline() pomocí definovaného objektu požadavku a uložte výstupní soubor aplikace Word vrácený v objektu odpovědi API.

Kód pro nástroj Word Page Extractor s Python REST API

Tento kód ukazuje jak uložit stránky jako DOC s Python Low Code API. Začátek a konec rozsahu můžete nastavit pomocí identifikátoru, jako je ‘page2’ nastavit číslo stránky 2, page2:end set konec stránky číslo 2, document:end set konec dokumentu a ‘id0.0.0’ nastavit cestu k uzlu. Tyto identifikátory pomáhají při nastavení rozsahu od libovolného uzlu v dokumentu do libovolné požadované pozice v dokumentu a ukládají výstup do samostatného souboru aplikace Word.

Tento článek nás naučil jak převádět stránky do Microsoft Word pomocí Python Low Code API. Pokud chcete extrahovat metadata ze souboru aplikace Word, přečtěte si následující článek: Extrahujte metadata z dokumentu Word pomocí Python REST API.

 Čeština