Extrahieren Sie Seiten aus Word mit der Python REST API

Dieser Artikel beschreibt, wie Sie Seiten aus Word mit der Python REST API extrahieren. Sie erfahren, wie Sie Seiten mit der Python REST API als DOCX speichern und dabei das Python Cloud SDK verwenden. Sie erhalten verschiedene Beispiele für Kennungen zum Festlegen von Anfang und Ende des Speicherbereichs als neue Word-Datei.

Voraussetzung

Schritte zum Extrahieren einer Seite aus einem Word-Dokument mit der Python Low Code API

  1. Initialisieren Sie das Klassenobjekt WordsApi, um einen Bereich aus einer Word-Datei zu extrahieren
  2. Erstellen Sie ein Anforderungsobjekt mit der Klasse SaveAsRangeOnlineRequest, um einen Bereich zu speichern
  3. Lesen Sie die Word-Quelldatei in das Anforderungsobjekt
  4. Definieren Sie den Anfang und das Ende des Bereichs, der aus der geladenen Word-Datei extrahiert werden soll
  5. Extrahieren Sie den Bereich mit der Methode SaveAsRangeOnline()
  6. Speichern Sie die Word-Ausgabedatei mit dem definierten Inhaltsbereich

Die obigen Schritte zeigen, wie Sie Seiten aus einem Word-Dokument mit der Python Low Code API extrahieren. Erstellen Sie zunächst das Klassenobjekt WordsApi und das Anforderungsobjekt SaveAsRangeOnlineRequest. Legen Sie dazu den Inhalt der Word-Eingabedatei, die Bereichsanfangs- und -endkennung sowie den Namen der Word-Ausgabedatei fest. Rufen Sie die Methode SaveAsRangeOnline() mit dem definierten Anforderungsobjekt auf und speichern Sie die zurückgegebene Word-Ausgabedatei im API-Antwortobjekt.

Code für Word-Seitenextraktor mit Python REST API

Dieser Code zeigt, wie man Seiten mit der Python Low Code API als DOC speichert. Sie können den Bereichsanfang und das Bereichsende mithilfe von Bezeichnern festlegen, z. B. page2 für Seite 2, page2:end für das Ende von Seite 2, document:end für das Ende des Dokuments und id0.0.0 für den Knotenpfad. Diese Bezeichner helfen dabei, den Bereich von jedem Knoten im Dokument bis zu jeder gewünschten Position im Dokument festzulegen und die Ausgabe in einer separaten Word-Datei zu speichern.

In diesem Artikel haben wir gelernt, wie man Seiten mit der Python Low Code API in Microsoft Word konvertiert. Wenn Sie Metadaten aus einer Word-Datei extrahieren möchten, lesen Sie den folgenden Artikel: Extrahieren Sie Metadaten aus Word-Dokumenten mit der Python REST-API.

 Deutsch