У цій статті описано, як витягнути текст із документа Word за допомогою Python REST API. Ви навчитеся автоматично видобувати текст із файлу Word за допомогою Python Low Code API, визначаючи початок і кінець тексту, який ви хочете отримати із завантаженого файлу Word. Ви можете встановити параметри діапазону різними способами, описаними в цій статті.
Обов’язкова умова
- Створіть обліковий запис і отримайте облікові дані API
- Завантажте Aspose.Words Cloud SDK для Python, щоб отримати діапазон тексту з файлу Word
- Налаштуйте проект рішення Python із зазначеним вище SDK для збереження діапазону в рядку
Кроки для вилучення певного тексту з документа Word за допомогою Python REST API
- Створіть об’єкт класу WordsApi, щоб отримати діапазон тексту з файлу Word
- Створіть об’єкт GetRangeTextOnlineRequest і завантажте в нього вміст вхідного файлу Word
- Встановіть параметри діапазону в об’єкті запиту, щоб визначити початок і кінець текстового діапазону
- Викличте метод GetRangeTextOnline, щоб отримати діапазон тексту
- Відображення тексту відповіді, яку повертає виклик API
Наведені вище кроки описують процес вилучення тексту з DOC за допомогою Python Low Code API. Розпочніть процес, створивши об’єкт класу WordsApi, використовуючи ідентифікатор клієнта та секрет, і ініціюйте об’єкт запиту, використовуючи клас GetRangeTextOnlineRequest. Заповніть параметри, щоб визначити діапазон тексту, і використовуйте його під час виклику методу GetRangeTextOnline(), який отримує дані з вихідного файлу.
Код для вилучення тексту з DOCX за допомогою Python REST API
Цей код демонструє як отримати текст із документа Word за допомогою Python REST API. GetRangeTextOnlineRequest містить параметри RangeStartIdentifier і RangeEndIdentifier, які можна використовувати для встановлення діапазону тексту, який потрібно отримати та зберегти в рядковій змінній. Використовуйте ідентифікатори діапазону, наприклад page3 показує номер сторінки 3, page3:end показує кінець сторінки 3, а document:end показує кінець документа.
Ця стаття навчила нас, як визначити діапазон тексту на сторінках і зберегти його в рядковій змінній. Щоб зберегти сторінку у файлі Word на зображенні, зверніться до такої статті: Перетворення сторінки Word на зображення за допомогою Python REST API.