Ekstrak Teks dari Dokumen Word dengan Python REST API

Artikel ini memandu cara mengekstrak teks dari dokumen Word dengan Python REST API. Anda akan mempelajari cara mengekstrak teks secara otomatis dari berkas Word dengan Python Low Code API dengan menentukan awal dan akhir teks yang ingin Anda ambil dari berkas Word yang dimuat. Anda dapat mengatur parameter rentang dengan berbagai cara yang dijelaskan dalam artikel ini.

Prasyarat

Langkah-Langkah Mengekstrak Teks Tertentu dari Dokumen Word dengan Python REST API

  1. Buat objek kelas WordsApi untuk mengekstrak rentang teks dari file Word
  2. Buat instance objek GetRangeTextOnlineRequest dan muat konten file Word input di dalamnya
  3. Tetapkan parameter rentang dalam objek permintaan untuk menentukan awal dan akhir rentang teks
  4. Panggil metode DapatkanRentangTeksOnline untuk mengekstrak rentang teks
  5. Menampilkan teks dari respons yang dikembalikan oleh panggilan API

Langkah-langkah di atas menjelaskan proses untuk mengekstrak teks dari DOC dengan Python Low Code API. Mulailah proses dengan membuat objek kelas WordsApi menggunakan ID klien dan rahasia, lalu mulai objek permintaan menggunakan kelas GetRangeTextOnlineRequest. Masukkan parameter untuk menentukan rentang teks dan gunakan parameter tersebut saat memanggil metode GetRangeTextOnline() yang mengambil data dari berkas sumber.

Kode untuk Mengekstrak Teks dari DOCX dengan Python REST API

Kode ini mendemonstrasikan cara mengekstrak teks dari dokumen Word dengan Python REST API. GetRangeTextOnlineRequest berisi parameter RangeStartIdentifier dan RangeEndIdentifier yang dapat digunakan untuk mengatur rentang teks yang ingin Anda ambil dan simpan dalam variabel string. Gunakan pengidentifikasi rentang seperti page3 menunjukkan nomor halaman 3, page3:end menunjukkan akhir halaman 3, dan document:end menunjukkan akhir dokumen.

Artikel ini mengajarkan kita cara menentukan rentang teks di seluruh halaman dan menyimpannya dalam variabel string. Untuk menyimpan halaman dalam berkas Word ke gambar, lihat artikel berikut: Konversi Halaman Word ke Gambar dengan Python REST API.

 Indonesian