Den här artikeln vägleder hur du extraherar text från Word dokument med NET REST API. Du kommer att lära dig att automatiskt extrahera text från Word-fil med C# Low Code API genom att definiera början och slutet av texten du vill hämta från den laddade Word-filen. Du kan ställa in intervallparametrarna på olika sätt som beskrivs i den här artikeln.
Nödvändig förutsättning
Ladda ner Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
Ställ in C#-lösningsprojekt med ovanstående SDK för att spara ett intervall till en sträng
Steg för att extrahera specifik text från Word-dokument med NET REST API
- Skapa klassobjektet WordsApi för att extrahera en rad text från en Word-fil
- Instantiera GetRangeTextOnlineRequest-objektet och ladda indata Word-filinnehåll i det
- Ställ in intervallparametrarna i begäranobjektet för att definiera början och slutet av textintervallet
- Anropa metoden GetRangeTextOnline för att extrahera textintervallet
- Visa texten från svaret som returneras av API-anropet
Ovanstående steg beskriver processen för att extrahera text från DOC med C# Low Code API. Börja processen genom att skapa WordsApi-klassobjektet med klient-ID och hemlighet, och initiera förfrågningsobjektet med klassen GetRangeTextOnlineRequest. Fyll i parametrarna för att definiera textintervallet och använd det medan du anropar metoden GetRangeTextOnline() som hämtar data från källfilen.
Kod för att extrahera text från DOCX med C# REST API
using System.IO; | |
using Aspose.Words.Cloud.Sdk; | |
using Aspose.Words.Cloud.Sdk.Model; | |
using Aspose.Words.Cloud.Sdk.Model.Requests; | |
namespace WordsSample.Words | |
{ | |
public class WordFileOperations | |
{ | |
public void ExtractTextRange() | |
{ | |
var wordsApi = new WordsApi("client id", "client secret");// For fetching text | |
var request = new GetRangeTextOnlineRequest(); | |
request.Document = File.OpenRead("Sample.docx"); | |
request.RangeStartIdentifier = "page0"; | |
request.RangeEndIdentifier = "page0:end"; | |
var task = wordsApi.GetRangeTextOnline(request); | |
task.Wait(); | |
var result = task.Result; | |
System.Console.WriteLine(result.Text); | |
} | |
} | |
} |
Den här koden visar hur man extraherar text från Word-dokument med C# REST API. GetRangeTextOnlineRequest innehåller parametrarna RangeStartIdentifier och RangeEndIdentifier som kan användas för att ställa in textintervallet som du vill hämta och spara i en strängvariabel. Använd intervallidentifierare som sida3 visar sidnummer 3, sida3:slut visar slutet av sida 3 och dokument:slut visar slutet av dokumentet.
Den här artikeln har lärt oss hur man definierar ett textintervall över sidorna och sparar det i en strängvariabel. För att spara en sida i en Word-fil till en bild, se följande artikel: Konvertera Word-sida till bild med NET REST API.