W tym artykule opisano, jak wyodrębnić tekst z dokumentu Word za pomocą interfejsu API NET REST. Dowiesz się, jak automatycznie wyodrębniać tekst z pliku Word za pomocą C# Low Code API, definiując początek i koniec tekstu, który chcesz pobrać z załadowanego pliku Word. Parametry zakresu możesz ustawić na różne sposoby opisane w tym artykule.
Warunek wstępny
Pobierać Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
Skonfiguruj projekt rozwiązania C# z powyższym zestawem SDK w celu zapisania zakresu w ciągu znaków
Kroki, aby wyodrębnić określony tekst z dokumentu programu Word za pomocą interfejsu API NET REST
- Utwórz obiekt klasy WordsApi, aby wyodrębnić zakres tekstu z pliku Word
- Utwórz instancję obiektu GetRangeTextOnlineRequest i załaduj do niego wejściową zawartość pliku Word
- Ustaw parametry zakresu w obiekcie żądania, aby zdefiniować początek i koniec zakresu tekstu
- Wywołaj metodę GetRangeTextOnline, aby wyodrębnić zakres tekstu
- Wyświetl tekst z odpowiedzi zwróconej przez wywołanie API
Powyższe kroki opisują proces wyodrębniania tekstu z DOC za pomocą interfejsu API C# Low Code. Rozpocznij proces od utworzenia obiektu klasy WordsApi przy użyciu identyfikatora klienta i sekretu, a następnie zainicjuj obiekt żądania przy użyciu klasy GetRangeTextOnlineRequest. Wypełnij parametry definiujące zakres tekstu i wykorzystaj je podczas wywoływania metody GetRangeTextOnline() pobierającej dane z pliku źródłowego.
Kod do wyodrębnienia tekstu z DOCX za pomocą interfejsu API C# REST
using System.IO; | |
using Aspose.Words.Cloud.Sdk; | |
using Aspose.Words.Cloud.Sdk.Model; | |
using Aspose.Words.Cloud.Sdk.Model.Requests; | |
namespace WordsSample.Words | |
{ | |
public class WordFileOperations | |
{ | |
public void ExtractTextRange() | |
{ | |
var wordsApi = new WordsApi("client id", "client secret");// For fetching text | |
var request = new GetRangeTextOnlineRequest(); | |
request.Document = File.OpenRead("Sample.docx"); | |
request.RangeStartIdentifier = "page0"; | |
request.RangeEndIdentifier = "page0:end"; | |
var task = wordsApi.GetRangeTextOnline(request); | |
task.Wait(); | |
var result = task.Result; | |
System.Console.WriteLine(result.Text); | |
} | |
} | |
} |
Ten kod demonstruje jak wyodrębnić tekst z dokumentu programu Word za pomocą interfejsu API C# REST. GetRangeTextOnlineRequest zawiera parametry RangeStartIdentifier i RangeEndIdentifier, których można użyć do ustawienia zakresu tekstu, który chcesz pobrać i zapisać w zmiennej łańcuchowej. Użyj identyfikatorów zakresu, takich jak page3 pokazuje numer strony 3, page3:end pokazuje koniec strony 3, a document:end pokazuje koniec dokumentu.
W tym artykule nauczyliśmy się, jak definiować zakres tekstu na stronach i zapisywać go w zmiennej łańcuchowej. Aby zapisać stronę w pliku Word na obrazie, zapoznaj się z następującym artykułem: Konwertuj stronę programu Word na obraz za pomocą interfejsu API NET REST.