Cet article explique comment extraire le texte d’un document Word avec l’API NET REST. Vous apprendrez à extraire automatiquement du texte d’un fichier Word avec l’API C# Low Code en définissant le début et la fin du texte que vous souhaitez récupérer à partir du fichier Word chargé. Vous pouvez définir les paramètres de plage de différentes manières décrites dans cet article.
Prérequis * Créez un compte et obtenez les informations d’identification de l’API
- Télécharger Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
- Configurer le projet de solution C# avec le SDK ci-dessus pour enregistrer une plage dans une chaîne
Étapes pour extraire du texte spécifique d’un document Word avec l’API NET REST
- Créez l’objet de classe WordsApi pour extraire une plage de texte d’un fichier Word.
- Instanciez l’objet GetRangeTextOnlineRequest et chargez-y le contenu du fichier Word d’entrée
- Définissez les paramètres de plage dans l’objet de requête pour définir le début et la fin de la plage de texte.
- Appelez la méthode GetRangeTextOnline pour extraire la plage de texte
- Afficher le texte de la réponse renvoyée par l’appel API
Les étapes ci-dessus décrivent le processus pour extraire du texte de DOC avec l’API C# Low Code. Commencez le processus en créant l’objet de classe WordsApi à l’aide de l’ID client et du secret, puis lancez l’objet de requête à l’aide de la classe GetRangeTextOnlineRequest. Remplissez les paramètres pour définir la plage de texte et utilisez-la tout en appelant la méthode GetRangeTextOnline() qui récupère les données du fichier source.
Code pour extraire du texte de DOCX avec l’API REST C#
Ce code montre comment extraire du texte d’un document Word avec l’API REST C#. GetRangeTextOnlineRequest contient les paramètres RangeStartIdentifier et RangeEndIdentifier qui peuvent être utilisés pour définir la plage de texte que vous souhaitez récupérer et enregistrer dans une variable de chaîne. Utilisez des identifiants de plage tels que page3 affiche le numéro de page 3, page3:end affiche la fin de la page 3 et document:end affiche la fin du document.
Cet article nous a appris comment définir une plage de texte sur les pages et l’enregistrer dans une variable chaîne. Pour enregistrer une page d’un fichier Word dans une image, reportez-vous à l’article suivant : Convertir une page Word en image avec l’API NET REST.