Metagegevens uit een Word-document extraheren met de Python REST API

Dit artikel beschrijft hoe u metadata uit een Word-document kunt extraheren met de Python REST API. U leert hoe u de Word DOC-metadata automatisch kunt lezen met de Python Low Code API met behulp van de Python Cloud SDK. Deze code vereist geen tool of software van derden om de informatie op te halen.

Voorwaarde

Stappen om documenteigenschappen op te halen in Word met Python REST API

  1. Instantieer het configuratieobject door de ClientId en ClientSecret in te stellen
  2. Maak het WordsApi-klasseobject met behulp van het configuratieobject
  3. Lees het invoer-Wordbestand in een byte-array
  4. Maak het GetDocumentPropertiesOnlineRequest-aanvraagobject voor het lezen van de metagegevens
  5. Roep de GetDocumentPropertiesOnline()-methode aan om de eigenschappen op te halen
  6. Analyseer alle eigenschappen in de API-respons en geef de informatie weer

Deze stappen definiëren het proces voor het ontwikkelen van een Word DOC metadataviewer met Python REST API. Instantieer het WordsApi-object met de client-ID, gevolgd door het inlezen van het invoer-Word-document in een byte-array. Maak ten slotte het request-object aan met de klasse GetDocumentPropertiesOnlineRequest en gebruik dit om de documenteigenschappen op te halen met de methode GetDocumentPropertiesOnline().

Code om Microsoft Word-eigenschappen te lezen met Python REST API

Deze voorbeeldcode laat zien hoe je een Word-metadataviewer met Python Low Code API ontwikkelt. Het resultaatobject bevat een verzameling documenteigenschappen met eigenschapsnamen en waardeparen. Als je Word-bronbestand met een wachtwoord is beveiligd, geef je het wachtwoord op in het aanvraagobject.

Dit artikel heeft ons de ontwikkeling van de metadataviewer voor Word-documenten met Python REST API geleerd. Als u de eigenschappen van een Word-bestand wilt wijzigen, raadpleeg dan het volgende artikel: Eigenschappen van een Word-document wijzigen met Python REST API.

 Nederlands