Node.js REST API ile PDF Belgesinden Metin Çıkarma

Bu kısa eğitim, Node.js REST API ile PDF belgesinden metin çıkarmayı açıklamaktadır. Node.js tabanlı bir Cloud SDK kullanarak Node.js tabanlı API ile PDF’den metin çıkarmayı öğreneceksiniz. PDF metnini okumak ve görüntülemek için örnek bir kod paylaşarak tüm süreci göstermektedir.

Önkoşul

Node.js Düşük Kod API’si ile PDF Metnini Çıkarma Adımları

  1. PDF dosyasını okumak için uygulama anahtarını ve SID’yi sağlayarak PdfApi‘yi yapılandırın
  2. Metni çıkarmak için kaynak PDF dosyasını yükleyin
  3. Kaynak PDF dosyasının başarıyla yüklenmesinin ardından Metin Al() yöntemini çağırın
  4. Tüm sayfalarda metnin alınacağı sayfanın dikdörtgen alanını ayarlayın
  5. API yanıtındaki metnin tüm oluşumlarını ayrıştırın ve metni görüntüleyin

Bu adımlar, Node.js RESTful Servisi ile PDF metnini okuma sürecini içerir. PDF dosyasını bulut depolama alanına yükleyin ve yüklenen PDF dosyasındaki tüm sayfalardaki metnin tüm örneklerini, sayfadaki belirtilen dikdörtgenden almak için GetText() yöntemini çağırın. Yanıttaki tüm örnekleri inceleyin ve sayfa numarasını ve metni görüntüleyin.

Node.js REST Arayüzü ile PDF’den Metin Alma Kodu

Bu kod, Node.js REST Arayüzü ile PDF’den metin alma işlemini göstermektedir. Dikdörtgen alan, sol alt x ve y konumu ile metni almak istediğiniz sağ üst x ve y konumundan oluşur. Tek bir sayfadan metin almanız gerekiyorsa, sayfayı seçmek için ek bir argüman olarak sayfa numarası gerektiren GetPageText() yöntemini kullanın.

Bu makale, sisteminizde yüklü herhangi bir PDF okuma yazılımı kullanmadan PDF dosyasını nasıl okuyacağınızı öğretti. Bir PDF dosyasındaki kelime sayısını saymak istiyorsanız, Node.js REST API ile PDF belgesindeki kelimeleri sayın makalesine bakın.

 Türkçe