C# REST API를 사용하여 PDF 문서에서 텍스트 추출

이 짧은 튜토리얼은 C# REST API로 PDF 문서에서 텍스트를 추출하는 방법을 설명합니다. .NET 기반 Cloud SDK를 사용하여 C# .NET 기반 API로 PDF에서 텍스트를 추출하는 방법을 배우게 됩니다. PDF 텍스트를 읽고 표시하기 위한 샘플 코드를 공유하여 전체 프로세스를 보여줍니다.

필수 조건

C# Low Code API를 사용하여 PDF 텍스트를 추출하는 단계

  1. PDF 파일을 읽기 위해 애플리케이션 키와 SID를 제공하여 PdfApi를 구성합니다.
  2. 텍스트 추출을 위한 소스 PDF 파일 업로드
  3. 소스 PDF 파일을 성공적으로 업로드하면 GetText() 메서드를 호출합니다.
  4. 모든 페이지에서 텍스트를 가져올 페이지의 직사각형 영역을 설정합니다.
  5. API 응답에서 텍스트의 모든 발생을 구문 분석하고 텍스트를 표시합니다.

이 단계는 C# RESTful Service로 PDF 텍스트를 읽는 프로세스를 수반합니다. PDF 파일을 클라우드 스토리지에 로드하고 GetText() 메서드를 호출하여 로드된 PDF 파일의 모든 페이지에서 지정된 사각형에서 텍스트의 모든 발생을 페치합니다. 응답의 모든 발생을 칭찬하고 페이지 번호와 텍스트를 표시합니다.

C# REST 인터페이스를 사용하여 PDF에서 텍스트를 가져오는 코드

이 코드는 C# REST 인터페이스로 PDF에서 텍스트를 검색하는 프로세스를 보여줍니다. 직사각형 영역은 텍스트를 가져오려는 왼쪽 아래 x 및 y 위치와 오른쪽 위 x 및 y 위치로 구성됩니다. 단일 페이지에서 텍스트를 가져와야 하는 경우 페이지를 선택하기 위해 추가 인수로 페이지 번호가 필요한 GetPageText() 메서드를 사용합니다.

이 문서에서는 시스템에 설치된 PDF 읽기 소프트웨어를 사용하지 않고 PDF 파일을 읽는 방법을 알려드렸습니다. PDF 파일의 단어 수를 세고 싶다면 C# REST API를 사용하여 PDF 문서의 단어 수 세기의 문서를 참조하세요.

 한국인