استخراج النص من مستند PDF باستخدام Node.js REST API

يشرح هذا البرنامج التعليمي الموجز كيفية استخراج نص من مستند PDF باستخدام واجهة برمجة تطبيقات Node.js REST. ستتعلم استخراج نص من ملف PDF باستخدام واجهة برمجة تطبيقات تعتمد على Node.js باستخدام مجموعة تطوير برمجيات سحابية تعتمد على Node.js. يوضح البرنامج العملية كاملةً من خلال مشاركة نموذج برمجي لقراءة وعرض نص PDF.

متطلب أساسي

خطوات استخراج نص PDF باستخدام واجهة برمجة تطبيقات Node.js منخفضة الكود

  1. قم بتكوين PdfApi عن طريق توفير مفتاح التطبيق وSID لقراءة ملف PDF
  2. قم بتحميل ملف PDF المصدر لاستخراج النص
  3. استدعاء طريقة الحصول على النص () عند تحميل ملف PDF المصدر بنجاح
  4. تعيين المنطقة المستطيلة للصفحة التي سيتم جلب النص منها على جميع الصفحات
  5. تحليل جميع تكرارات النص في استجابة واجهة برمجة التطبيقات وعرض النص

تتضمن هذه الخطوات عملية قراءة نص PDF باستخدام خدمة Node.js RESTful. حمّل ملف PDF إلى وحدة التخزين السحابية، واستدعِ دالة GetText() لجلب جميع تكرارات النص من جميع صفحات ملف PDF المُحمّل، بدءًا من المستطيل المُحدد في الصفحة. استعرض جميع تكرارات النص في الاستجابة، واعرض رقم الصفحة والنص.

كود لاستخراج نص من PDF باستخدام واجهة Node.js REST

يوضح هذا الكود عملية استرجاع نص من ملف PDF باستخدام واجهة Node.js REST. تتكون المنطقة المستطيلة من موضعي x وy السفلي الأيسر وx وy العلوي الأيمن اللذين تريد جلب النص منهما. إذا كنت ترغب في جلب نص من صفحة واحدة، فاستخدم دالة GetPageText() التي تتطلب رقم الصفحة كمعامل إضافي لتحديد الصفحة.

علّمتنا هذه المقالة قراءة ملفات PDF دون الحاجة إلى استخدام أي برنامج قراءة PDF مُثبّت على جهازك. إذا كنت ترغب في حساب عدد كلمات ملف PDF، يُرجى مراجعة المقالة عد الكلمات في مستند PDF باستخدام Node.js REST API.

 عربي