Tento článek popisuje, jak extrahovat text z dokumentu Word pomocí NET REST API. Naučíte se automaticky extrahovat text ze souboru aplikace Word pomocí C# Low Code API definováním začátku a konce textu, který chcete načíst z načteného souboru aplikace Word. Parametry rozsahu můžete nastavit různými způsoby popsanými v tomto článku.
Předpoklad
Stažení Aspose.Words Cloud SDK for Dotnet to extract a range of text from a Word file
Nastavení projektu řešení C# s výše uvedenou sadou SDK pro uložení rozsahu do řetězce
Kroky k extrahování konkrétního textu z dokumentu Word pomocí NET REST API
- Vytvořte objekt třídy WordsApi pro extrahování rozsahu textu ze souboru aplikace Word
- Vytvořte instanci objektu GetRangeTextOnlineRequest a načtěte do něj obsah vstupního souboru aplikace Word
- Nastavením parametrů rozsahu v objektu požadavku definujte začátek a konec rozsahu textu
- Chcete-li extrahovat rozsah textu, zavolejte metodu GetRangeTextOnline
- Zobrazte text z odpovědi vrácené voláním API
Výše uvedené kroky popisují proces extrakce textu z DOC pomocí C# Low Code API. Začněte proces vytvořením objektu třídy WordsApi pomocí ID klienta a tajného klíče a iniciujte objekt požadavku pomocí třídy GetRangeTextOnlineRequest. Vyplňte parametry pro definování rozsahu textu a použijte jej při volání metody GetRangeTextOnline(), která načítá data ze zdrojového souboru.
Kód pro extrahování textu z DOCX pomocí C# REST API
Tento kód ukazuje jak extrahovat text z dokumentu Word pomocí C# REST API. GetRangeTextOnlineRequest obsahuje parametry RangeStartIdentifier a RangeEndIdentifier, které lze použít k nastavení rozsahu textu, který chcete načíst a uložit do řetězcové proměnné. Použijte identifikátory rozsahu, jako je page3 ukazuje číslo stránky 3, page3:end ukazuje konec stránky 3 a document:end ukazuje konec dokumentu.
Tento článek nás naučil, jak definovat rozsah textu na stránkách a uložit jej do proměnné řetězce. Chcete-li uložit stránku v souboru aplikace Word do obrázku, přečtěte si následující článek: Převeďte Word Page na obrázek pomocí NET REST API.