Bu kısa eğitim, Node.js REST API ile PDF belgesinden metin çıkarmayı açıklamaktadır. Node.js tabanlı bir Cloud SDK kullanarak Node.js tabanlı API ile PDF’den metin çıkarmayı öğreneceksiniz. PDF metnini okumak ve görüntülemek için örnek bir kod paylaşarak tüm süreci göstermektedir.
Önkoşul
- Bir hesap oluşturun API kimlik bilgileri PDF’den metin çıkar
- PDF dosyasını okumak için Node.js için Aspose.PDF Cloud SDK‘i indirin
- Yukarıdaki SDK ile metin almak için Node.js projesini kurun
Node.js Düşük Kod API’si ile PDF Metnini Çıkarma Adımları
- PDF dosyasını okumak için uygulama anahtarını ve SID’yi sağlayarak PdfApi‘yi yapılandırın
- Metni çıkarmak için kaynak PDF dosyasını yükleyin
- Kaynak PDF dosyasının başarıyla yüklenmesinin ardından Metin Al() yöntemini çağırın
- Tüm sayfalarda metnin alınacağı sayfanın dikdörtgen alanını ayarlayın
- API yanıtındaki metnin tüm oluşumlarını ayrıştırın ve metni görüntüleyin
Bu adımlar, Node.js RESTful Servisi ile PDF metnini okuma sürecini içerir. PDF dosyasını bulut depolama alanına yükleyin ve yüklenen PDF dosyasındaki tüm sayfalardaki metnin tüm örneklerini, sayfadaki belirtilen dikdörtgenden almak için GetText() yöntemini çağırın. Yanıttaki tüm örnekleri inceleyin ve sayfa numarasını ve metni görüntüleyin.
Node.js REST Arayüzü ile PDF’den Metin Alma Kodu
Bu kod, Node.js REST Arayüzü ile PDF’den metin alma işlemini göstermektedir. Dikdörtgen alan, sol alt x ve y konumu ile metni almak istediğiniz sağ üst x ve y konumundan oluşur. Tek bir sayfadan metin almanız gerekiyorsa, sayfayı seçmek için ek bir argüman olarak sayfa numarası gerektiren GetPageText() yöntemini kullanın.
Bu makale, sisteminizde yüklü herhangi bir PDF okuma yazılımı kullanmadan PDF dosyasını nasıl okuyacağınızı öğretti. Bir PDF dosyasındaki kelime sayısını saymak istiyorsanız, Node.js REST API ile PDF belgesindeki kelimeleri sayın makalesine bakın.