Ekstrak Teks dari Dokumen PDF dengan C# REST API

Tutorial singkat ini menjelaskan cara mengekstrak teks dari dokumen PDF dengan C# REST API. Anda akan belajar mengekstrak teks dari PDF dengan API berbasis C# .NET menggunakan Cloud SDK berbasis .NET. Tutorial ini mendemonstrasikan proses lengkap dengan membagikan contoh kode untuk membaca dan menampilkan teks PDF.

Prasyarat

Langkah-langkah untuk Mengekstrak Teks PDF dengan C# Low Code API

  1. Konfigurasikan PdfApi dengan memberikan kunci aplikasi dan SID untuk membaca file PDF
  2. Unggah file PDF sumber untuk mengekstrak teks
  3. Panggil metode GetText() setelah berhasil mengunggah file PDF sumber
  4. Mengatur area persegi panjang halaman tempat teks akan diambil di semua halaman
  5. Menguraikan semua kemunculan teks dalam respons API dan menampilkan teksnya

Langkah-langkah ini memerlukan proses untuk membaca teks PDF dengan Layanan C# RESTful. Muat berkas PDF ke penyimpanan Cloud dan panggil metode GetText() untuk mengambil semua kemunculan teks dari semua halaman dalam berkas PDF yang dimuat dari persegi panjang yang ditentukan pada halaman. Berikan pujian melalui semua kemunculan dalam respons dan tampilkan nomor halaman dan teks.

Kode untuk Mengambil Teks dari PDF dengan Antarmuka C# REST

Kode ini menunjukkan proses untuk mengambil teks dari PDF dengan Antarmuka C# REST. Area persegi panjang terdiri dari posisi x dan y kiri bawah dan posisi x dan y kanan atas tempat Anda ingin mengambil teks. Jika Anda perlu mengambil teks dari satu halaman, gunakan metode GetPageText() yang memerlukan nomor halaman sebagai argumen tambahan untuk memilih halaman.

Artikel ini mengajarkan kita cara membaca berkas PDF tanpa menggunakan perangkat lunak pembaca PDF apa pun yang terpasang di sistem Anda. Jika Anda ingin menghitung jumlah kata dalam berkas PDF, lihat artikel di Hitung kata dalam dokumen PDF dengan C# REST API.

 Indonesian