Extrair texto de um documento do Word com a API REST do Python

Este artigo explica como extrair texto do documento Word com a API REST do Python. Você aprenderá a extrair texto automaticamente de um arquivo do Word com a API Low Code do Python, definindo o início e o fim do texto que deseja buscar no arquivo do Word carregado. Você pode definir os parâmetros de intervalo de várias maneiras descritas neste artigo.

Pré-requisito

  • {{HIPERLINK1}}
  • Baixe Aspose.Words Cloud SDK para Python para extrair um intervalo de texto de um arquivo do Word
  • Configurar projeto de solução Python com o SDK acima para salvar um intervalo em uma string

Etapas para extrair texto específico de um documento do Word com a API REST do Python

  1. Crie o objeto de classe WordsApi para extrair um intervalo de texto de um arquivo do Word
  2. Instanciar o objeto GetRangeTextOnlineRequest e carregar o conteúdo do arquivo Word de entrada nele
  3. Defina os parâmetros de intervalo no objeto de solicitação para definir o início e o fim do intervalo de texto
  4. Chame o método Obter texto de alcance online para extrair o intervalo de texto
  5. Exibe o texto da resposta retornada pela chamada da API

As etapas acima descrevem o processo para extrair texto de um DOC com a API Python Low Code. Inicie o processo criando o objeto da classe WordsApi usando o ID e o segredo do cliente e inicie o objeto de solicitação usando a classe GetRangeTextOnlineRequest. Preencha os parâmetros para definir o intervalo de texto e use-os ao chamar o método GetRangeTextOnline() que busca dados do arquivo de origem.

Código para extrair texto de DOCX com API REST do Python

Este código demonstra como extrair texto de um documento do Word com a API REST do Python. O GetRangeTextOnlineRequest contém os parâmetros RangeStartIdentifier e RangeEndIdentifier, que podem ser usados ​​para definir o intervalo de texto que você deseja buscar e salvar em uma variável de string. Use identificadores de intervalo como page3, page3:end …

Este artigo nos ensinou como definir um intervalo de texto nas páginas e salvá-lo em uma variável de string. Para salvar uma página em um arquivo do Word como uma imagem, consulte o seguinte artigo: Converter página do Word em imagem com a API REST do Python.

 Português