Extrahieren Sie Metadaten aus Word-Dokumenten mit der Python REST-API

Dieser Artikel beschreibt, wie Sie Metadaten aus einem Word-Dokument mit der Python REST API extrahieren. Sie lernen, die Word-DOC-Metadaten mit der Python Low Code API mithilfe des Python Cloud SDK automatisch zu lesen. Dieser Code benötigt keine Drittanbieter-Tools oder -Software zum Abrufen der Informationen.

Voraussetzung

Schritte zum Abrufen von Dokumenteigenschaften in Word mit der Python REST API

  1. Instanziieren Sie das Konfigurationsobjekt, indem Sie die ClientId und das ClientSecret festlegen
  2. Erstellen Sie das Klassenobjekt WordsApi mithilfe des Konfigurationsobjekts
  3. Lesen Sie die eingegebene Word-Datei in ein Byte-Array
  4. Erstellen Sie das GetDocumentPropertiesOnlineRequest-Anforderungsobjekt zum Lesen der Metadaten
  5. Rufen Sie die Methode GetDocumentPropertiesOnline() auf, um die Eigenschaften abzurufen
  6. Analysieren Sie alle Eigenschaften in der API-Antwort und zeigen Sie die Informationen an

Diese Schritte beschreiben die Entwicklung eines Word-Dokument-Metadaten-Viewers mit Python REST API. Instanziieren Sie das WordsApi-Objekt mit der Client-ID und lesen Sie anschließend das eingegebene Word-Dokument in ein Byte-Array ein. Erstellen Sie abschließend das Anforderungsobjekt mit der Klasse GetDocumentPropertiesOnlineRequest und rufen Sie damit die Dokumenteigenschaften mit der Methode GetDocumentPropertiesOnline() ab.

Code zum Lesen von Microsoft Word-Eigenschaften mit der Python REST-API

Dieser Beispielcode zeigt, wie Sie einen Word-Metadaten-Viewer mit der Python Low Code API entwickeln. Das Ergebnisobjekt enthält eine Sammlung von Dokumenteigenschaften mit Eigenschaftsnamen und Wertepaaren. Falls Ihre Word-Quelldatei passwortgeschützt ist, geben Sie das Passwort im Anforderungsobjekt an.

In diesem Artikel haben wir die Entwicklung des Word-Dokument-Metadaten-Viewers mit Python REST API kennengelernt. Wenn Sie die Eigenschaften einer Word-Datei ändern möchten, lesen Sie den folgenden Artikel: Ändern Sie die Eigenschaften eines Word-Dokuments mit der Python REST API.

 Deutsch