Extraire du texte d'un document Word avec l'API NET REST

Cet article explique comment extraire du texte d’un document Word avec l’API REST NET. Vous apprendrez à extraire automatiquement du texte d’un fichier Word avec l’API Low Code C# en définissant le début et la fin du texte à extraire du fichier Word chargé. Vous pouvez définir les paramètres de plage de différentes manières, décrites dans cet article.

Condition préalable

Étapes pour extraire un texte spécifique d’un document Word avec l’API REST NET

  1. Créez l’objet de classe WordsApi pour extraire une plage de texte d’un fichier Word
  2. Instanciez l’objet GetRangeTextOnlineRequest et chargez-y le contenu du fichier Word d’entrée
  3. Définissez les paramètres de plage dans l’objet de requête pour définir le début et la fin de la plage de texte
  4. Appelez la méthode GetRangeTextOnline pour extraire la plage de texte
  5. Afficher le texte de la réponse renvoyée par l’appel d’API

Les étapes ci-dessus décrivent le processus d’extraction de texte d’un document DOC avec l’API Low Code C#. Commencez par créer l’objet de classe WordsApi à l’aide de l’ID client et du secret, puis lancez l’objet de requête avec la classe GetRangeTextOnlineRequest. Renseignez les paramètres pour définir la plage de texte et utilisez-la lors de l’appel de la méthode GetRangeTextOnline() qui récupère les données du fichier source.

Code pour extraire du texte d’un fichier DOCX avec l’API REST C#

Ce code montre comment extraire du texte d’un document Word avec l’API REST C#. La requête GetRangeTextOnlineRequest contient les paramètres RangeStartIdentifier et RangeEndIdentifier, qui permettent de définir la plage de texte à récupérer et à enregistrer dans une variable de chaîne. Utilisez des identifiants de plage tels que page3 : page numéro 3, page3:end : fin de la page 3 et document:end : fin du document.

Cet article nous a appris à définir une plage de texte sur plusieurs pages et à l’enregistrer dans une variable de chaîne. Pour enregistrer une page d’un fichier Word au format image, consultez l’article suivant : Convertir une page Word en image avec l’API NET REST.

 Français