Ekstrak Teks dari Dokumen PDF dengan Node.js REST API

Tutorial singkat ini menjelaskan cara mengekstrak teks dari dokumen PDF dengan Node.js REST API. Anda akan belajar mengekstrak teks dari PDF dengan API berbasis Node.js menggunakan Cloud SDK berbasis Node.js. Tutorial ini mendemonstrasikan proses lengkap dengan membagikan contoh kode untuk membaca dan menampilkan teks PDF.

Prasyarat

Langkah-Langkah Ekstrak Teks PDF dengan Node.js Low Code API

  1. Konfigurasikan PdfApi dengan memberikan kunci aplikasi dan SID untuk membaca file PDF
  2. Unggah file PDF sumber untuk mengekstrak teks
  3. Panggil metode DapatkanTeks() setelah berhasil mengunggah file PDF sumber
  4. Mengatur area persegi panjang halaman tempat teks akan diambil di semua halaman
  5. Menguraikan semua kemunculan teks dalam respons API dan menampilkan teksnya

Langkah-langkah ini mencakup proses membaca teks PDF dengan Layanan RESTful Node.js. Muat berkas PDF ke penyimpanan Cloud dan panggil metode GetText() untuk mengambil semua kemunculan teks dari semua halaman dalam berkas PDF yang dimuat dari persegi panjang yang ditentukan pada halaman tersebut. Periksa semua kemunculan dalam respons dan tampilkan nomor halaman serta teks.

Kode untuk Mengambil Teks dari PDF dengan Antarmuka REST Node.js

Kode ini mendemonstrasikan proses untuk mengambil teks dari PDF dengan Antarmuka REST Node.js. Area persegi panjang terdiri dari posisi x dan y di kiri bawah dan posisi x dan y di kanan atas, di mana Anda ingin mengambil teks. Jika Anda perlu mengambil teks dari satu halaman, gunakan metode GetPageText() yang memerlukan nomor halaman sebagai argumen tambahan untuk memilih halaman tersebut.

Artikel ini mengajarkan kita cara membaca berkas PDF tanpa menggunakan perangkat lunak pembaca PDF apa pun yang terpasang di sistem Anda. Jika Anda ingin menghitung jumlah kata dalam berkas PDF, silakan lihat artikel tentang Hitung kata dalam dokumen PDF dengan Node.js REST API.

 Indonesian