この記事では、Python REST API を使用して Word からページを抽出する方法 について説明します。また、Python クラウド SDK を使用して、Python REST API を使用してページを DOCX として保存する方法 についても説明します。新しい Word ファイルとして保存する際の範囲の開始と終了を設定するための識別子のサンプルもいくつか紹介します。
前提条件
- {{ハイパーリンク1}}
- Word ファイルから範囲を抽出するには Python 用 Aspose.Words Cloud SDK をダウンロードしてください
- 上記の SDK を使用して、範囲を Word ファイルに保存するための Python ソリューション プロジェクトをセットアップします。
Python Low Code API を使用して Word 文書からページを抽出する手順
- WordsApiクラスオブジェクトを初期化してWordファイルから範囲を抽出します
- SaveAsRangeOnlineRequestクラスを使用して範囲を保存するリクエストオブジェクトを作成する
- ソースWordファイルをリクエストオブジェクトに読み込む
- 読み込んだWordファイルから抽出する範囲の開始と終了を定義します
- SaveAsRangeOnline()メソッドを使用して範囲を抽出します
- 定義された範囲のコンテンツを含む出力Wordファイルを保存します。
上記の手順は、Python Low Code APIを使用してWord文書からページを抽出する方法を示しています。まず、WordsApiクラスオブジェクトを作成し、入力Wordファイルの内容、範囲の開始識別子、終了識別子、出力Wordファイル名を設定してSaveAsRangeOnlineRequestリクエストオブジェクトを作成します。定義したリクエストオブジェクトを使用してSaveAsRangeOnline()メソッドを呼び出し、APIレスポンスオブジェクトで返された出力Wordファイルを保存します。
Python REST API を使用した Word ページ抽出ツールのコード
このコードは、Python Low Code APIを使ってページをDOC形式で保存する方法を示しています。範囲の開始と終了は識別子を使って設定できます。例えば、「page2」はページ番号2、「page2:end」はページ番号2の終了、「document:end」はドキュメントの終了、「id0.0.0」はノードのパスです。これらの識別子は、ドキュメント内の任意のノードから任意の位置までの範囲を設定し、出力を別のWordファイルに保存するのに役立ちます。
この記事では、Python Low Code APIを使ってページをMicrosoft Wordに変換する方法を説明しました。Wordファイルからメタデータを抽出したい場合は、次の記事をご覧ください: Python REST API を使用して Word 文書からメタデータを抽出する。