Dit artikel beschrijft hoe u tekst uit een Word-document kunt extraheren met de NET REST API. U leert hoe u automatisch tekst uit een Word-bestand kunt extraheren met de C# Low Code API door het begin en einde te definiëren van de tekst die u uit het geladen Word-bestand wilt ophalen. U kunt de bereikparameters op verschillende manieren instellen, zoals beschreven in dit artikel.
Voorwaarde
- Maak een account aan en ontvang API-referenties
- Download Aspose.Words Cloud SDK voor Dotnet om een tekstbereik uit een Word-bestand te halen
- Stel een C#-oplossingsproject in met de bovenstaande SDK voor het opslaan van een bereik in een tekenreeks
Stappen om specifieke tekst uit een Word-document te extraheren met NET REST API
- Maak het WordsApi-klasseobject om een tekstbereik uit een Word-bestand te halen
- Instantieer het GetRangeTextOnlineRequest-object en laad de inhoud van het invoer-Word-bestand erin
- Stel de bereikparameters in het aanvraagobject in om het begin en einde van het tekstbereik te definiëren
- Roep de GetRangeTextOnline-methode aan om het tekstbereik te extraheren
- Geef de tekst weer uit het antwoord dat door de API-aanroep wordt geretourneerd
De bovenstaande stappen beschrijven het proces om tekst uit DOC te extraheren met de C# Low Code API. Begin het proces door het WordsApi-klasseobject aan te maken met behulp van de client-ID en het geheim, en initieer het aanvraagobject met de GetRangeTextOnlineRequest-klasse. Vul de parameters in om het tekstbereik te definiëren en gebruik dit bij het aanroepen van de GetRangeTextOnline()-methode die gegevens uit het bronbestand ophaalt.
Code om tekst uit DOCX te extraheren met C# REST API
Deze code demonstreert hoe je tekst uit een Word-document extraheert met de C# REST API. De GetRangeTextOnlineRequest bevat de parameters RangeStartIdentifier en RangeEndIdentifier, waarmee je het tekstbereik kunt instellen dat je wilt ophalen en opslaan in een stringvariabele. Gebruik bereik-ID’s zoals ‘page3’ toont paginanummer 3, ‘page3:end’ toont het einde van pagina 3 en ‘document:end’ toont het einde van het document.
Dit artikel heeft ons geleerd hoe we een tekstbereik over pagina’s kunnen definiëren en opslaan in een tekenreeksvariabele. Raadpleeg het volgende artikel om een pagina in een Word-bestand als afbeelding op te slaan: Converteer een Word-pagina naar een afbeelding met NET REST API.