NET REST API を使用して Word 文書からテキストを抽出する

この記事では、NET REST API を使用して Word ドキュメントからテキストを抽出する 方法について説明します。読み込まれた Word ファイルから取得するテキストの開始と終了を定義することで、C# Low Code API を使用して Word ファイルからテキストを自動的に抽出する 方法を学習します。この記事で説明するさまざまな方法で範囲パラメータを設定できます。

前提条件

NET REST API を使用して Word 文書から特定のテキストを抽出する手順

  1. WordsApiクラスオブジェクトを作成して、Wordファイルからテキストの範囲を抽出します。
  2. GetRangeTextOnlineRequestオブジェクトをインスタンス化し、そこに入力Wordファイルのコンテンツをロードします。
  3. リクエストオブジェクトの範囲パラメータを設定して、テキスト範囲の開始と終了を定義します。
  4. GetRangeTextOnlineメソッドを呼び出してテキストの範囲を抽出します
  5. API呼び出しによって返された応答のテキストを表示する

上記の手順は、C# Low Code API を使用して DOC からテキストを抽出するプロセスについて説明しています。クライアント ID とシークレットを使用して WordsApi クラス オブジェクトを作成し、GetRangeTextOnlineRequest クラスを使用して要求オブジェクトを初期化することでプロセスを開始します。パラメータを入力してテキストの範囲を定義し、ソース ファイルからデータを取得する GetRangeTextOnline() メソッドを呼び出すときにそれを使用します。

C# REST API を使用して DOCX からテキストを抽出するコード

このコードは、C# REST API を使用して Word 文書からテキストを抽出する方法を示しています。GetRangeTextOnlineRequest には、取得して文字列変数に保存するテキストの範囲を設定するために使用できる RangeStartIdentifier および RangeEndIdentifier パラメーターが含まれています。page3 はページ番号 3 を示し、page3:end はページ 3 の終わりを示し、document:end は文書の終わりを示すなど、範囲識別子を使用します。

この記事では、ページ全体にわたるテキストの範囲を定義し、それを文字列変数に保存する方法を説明しました。Word ファイルのページを画像として保存するには、次の記事を参照してください: NET REST API を使用して Word ページを画像に変換する

 日本語