C# REST API を使用して PDF ドキュメントからテキストを抽出する

この短いチュートリアルでは、C# REST API を使用して PDF ドキュメントからテキストを抽出する 方法について説明します。.NET ベースの Cloud SDK を使用して、C# .NET ベースの API を使用して PDF からテキストを抽出する 方法を学習します。PDF テキストを読み取って表示するためのサンプルコードを共有することで、完全なプロセスを示します。

前提条件

アカウントAPI認証情報を作成 PDF からテキストを抽出する
ダウンロード Aspose.PDF Cloud SDK for Dotnet to read a PDF file
テキストを取得するための上記のSDKを使用してC#プロジェクトをセットアップします

C# ローコード API を使用して PDF テキストを抽出する手順

PDFファイルを読み取るためのアプリケーションキーとSIDを指定してPdfApiを設定します
テキストを抽出するためのソースPDFファイルをアップロードします
ソースPDFファイルのアップロードが成功したらGetText()メソッドを呼び出します。
すべてのページでテキストを取得するページの長方形領域を設定します
APIレスポンス内のテキストの出現箇所をすべて解析し、テキストを表示します。

これらの手順には、C# RESTful サービスを使用して PDF テキストを読み取るプロセスが含まれます。PDF ファイルをクラウドストレージに読み込み、GetText() メソッドを呼び出して、読み込まれた PDF ファイル内のすべてのページから、ページ上の指定された四角形にあるテキストのすべての出現箇所を取得します。応答ですべての出現箇所を評価し、ページ番号とテキストを表示します。

C# REST インターフェイスを使用して PDF からテキストを取得するコード

	using System;
	using System.IO;
	using Aspose.Pdf.Cloud.Sdk.Api;
	using Aspose.Pdf.Cloud.Sdk.Model;
	using System.Collections.Generic;

	namespace Aspose.PDF.Cloud.Examples.Kb
	{
	public class PdfTasks
	{
	public static void ReadPdf()
	{
	PdfApi pdfApi = new PdfApi("APP_KEY", "APP_SID");
	String fileName = "TextAndImages.pdf";
	try
	{
	// Upload source file
	FilesUploadResult result = pdfApi.UploadFile(fileName, new MemoryStream(File.ReadAllBytes(fileName)));
	if (result.Errors.Count == 0)
	{
	TextRectsResponse response = pdfApi.GetText(fileName, 0, 0, 500, 600);
	foreach(var occurrence in response.TextOccurrences.List)
	{
	Console.WriteLine($"Page:{occurrence.Page} Text:{occurrence.Text}");
	}
	}
	}
	catch (Exception ex)
	{
	Console.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
	}
	}
	}
	}

view raw Extract Pictures from PDF with C# REST API.cs hosted with ❤ by GitHub

このコードは、C# REST インターフェイスを使用して PDF からテキストを取得するプロセスを示しています。長方形の領域は、テキストを取得する左下の x 位置と y 位置、および右上の x 位置と y 位置で構成されます。1 ページからテキストを取得する必要がある場合は、ページを選択するための追加引数としてページ番号を必要とする GetPageText() メソッドを使用します。

この記事では、システムにインストールされている PDF 読み取りソフトウェアを使用せずに PDF ファイルを読み取る方法を説明しました。PDF ファイル内の単語数をカウントしたい場合は、C# REST API を使用して PDF ドキュメント内の単語数をカウントするの記事を参照してください。

Aspose.cloud 知識ベース

APIで回答を見つけます

C# REST API を使用して PDF ドキュメントからテキストを抽出する

C# ローコード API を使用して PDF テキストを抽出する手順

C# REST インターフェイスを使用して PDF からテキストを取得するコード