이 글에서는 NodeJ의 REST API를 사용하여 Word 문서에서 텍스트를 추출하는 방법을 안내합니다. 로드된 Word 파일에서 가져올 텍스트의 시작과 끝을 정의하여 NodeJ의 Low Code API를 사용하여 Word 파일에서 텍스트를 자동으로 추출하는 방법을 알아봅니다. 이 글에 설명된 다양한 방법으로 범위 매개변수를 설정할 수 있습니다.
필수 조건
- {{하이퍼링크1}}
- Word 파일에서 텍스트 범위를 추출하려면 Node.js용 Aspose.Words Cloud SDK을 다운로드하세요.
- 위의 SDK를 사용하여 범위를 문자열로 저장하기 위한 Nodej.s 솔루션 프로젝트를 설정합니다.
Node.js REST API를 사용하여 Word 문서에서 특정 텍스트를 추출하는 단계
- Word 파일에서 텍스트 범위를 추출하려면 WordsApi 클래스 객체를 만듭니다.
- GetRangeTextOnlineRequest 객체를 인스턴스화하고 입력 Word 파일 콘텐츠를 로드합니다.
- 요청 객체에서 범위 매개변수를 설정하여 텍스트 범위의 시작과 끝을 정의합니다.
- GetRangeTextOnline 메서드를 호출하여 텍스트 범위를 추출합니다.
- API 호출에서 반환된 응답의 텍스트를 표시합니다.
위 단계는 Node.js Low Code API를 사용하여 DOC에서 텍스트를 추출하는 과정을 설명합니다. 클라이언트 ID와 비밀번호를 사용하여 WordsApi 클래스 객체를 생성하고, GetRangeTextOnlineRequest 클래스를 사용하여 요청 객체를 초기화하여 프로세스를 시작합니다. 텍스트 범위를 정의하는 매개변수를 입력하고, 소스 파일에서 데이터를 가져오는 GetRangeTextOnline() 메서드를 호출할 때 이 매개변수를 사용합니다.
Node.j.s REST API를 사용하여 DOCX에서 텍스트를 추출하는 코드
이 코드는 Node.js REST API를 사용하여 Word 문서에서 텍스트를 추출하는 방법을 보여줍니다. GetRangeTextOnlineRequest에는 RangeStartIdentifier와 RangeEndIdentifier 매개변수가 포함되어 있으며, 이 매개변수를 사용하여 가져오고 문자열 변수에 저장할 텍스트 범위를 설정할 수 있습니다. page3은 페이지 번호 3을, page3:end는 페이지 3의 끝을, document:end는 문서의 끝을 나타내는 범위 식별자를 사용하세요.
이 문서에서는 여러 페이지에 걸쳐 텍스트 범위를 정의하고 문자열 변수에 저장하는 방법을 설명했습니다. Word 파일의 페이지를 이미지로 저장하려면 다음 문서를 참조하세요. Node.j.s REST API를 사용하여 Word 페이지를 이미지로 변환.