Dieser Artikel beschreibt, wie Sie Text aus einem Word-Dokument mit NET REST API extrahieren. Sie lernen, wie Sie automatisch Text aus einer Word-Datei mit C# Low Code API extrahieren, indem Sie den Anfang und das Ende des Textes definieren, den Sie aus der geladenen Word-Datei abrufen möchten. Sie können die Bereichsparameter auf verschiedene Arten festlegen, die in diesem Artikel beschrieben werden.
Voraussetzung
Herunterladen Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
Richten Sie ein C#-Lösungsprojekt mit dem obigen SDK ein, um einen Bereich in einer Zeichenfolge zu speichern
Schritte zum Extrahieren bestimmten Textes aus einem Word-Dokument mit der NET REST API
- Erstellen Sie das Klassenobjekt WordsApi, um einen Textbereich aus einer Word-Datei zu extrahieren
- Instanziieren Sie das GetRangeTextOnlineRequest-Objekt und laden Sie den Inhalt der eingegebenen Word-Datei darin
- Legen Sie die Bereichsparameter im Anforderungsobjekt fest, um den Anfang und das Ende des Textbereichs zu definieren.
- Rufen Sie die Methode GetRangeTextOnline auf, um den Textbereich zu extrahieren
- Zeigt den Text aus der vom API-Aufruf zurückgegebenen Antwort an.
Die obigen Schritte beschreiben den Prozess zum Extrahieren von Text aus DOC mit C# Low Code API. Beginnen Sie den Prozess, indem Sie das Klassenobjekt WordsApi mit der Client-ID und dem Geheimnis erstellen und das Anforderungsobjekt mit der Klasse GetRangeTextOnlineRequest initiieren. Füllen Sie die Parameter aus, um den Textbereich zu definieren, und verwenden Sie ihn beim Aufrufen der Methode GetRangeTextOnline(), die Daten aus der Quelldatei abruft.
Code zum Extrahieren von Text aus DOCX mit der C#-REST-API
Dieser Code zeigt, wie man mit der C# REST API Text aus einem Word-Dokument extrahiert. Die GetRangeTextOnlineRequest enthält die Parameter RangeStartIdentifier und RangeEndIdentifier, mit denen der Textbereich festgelegt werden kann, den Sie abrufen und in einer Zeichenfolgenvariable speichern möchten. Verwenden Sie Bereichskennungen wie page3 zeigt Seitenzahl 3, page3:end zeigt das Ende von Seite 3 und document:end zeigt das Ende des Dokuments.
In diesem Artikel haben wir gelernt, wie man einen Textbereich über die Seiten definiert und in einer Zeichenfolgenvariable speichert. Informationen zum Speichern einer Seite in einer Word-Datei als Bild finden Sie im folgenden Artikel: Konvertieren Sie eine Word-Seite mit der NET REST API in ein Bild.