يشرح هذا البرنامج التعليمي الموجز كيفية استخراج نص من مستند PDF باستخدام واجهة برمجة تطبيقات Node.js REST. ستتعلم استخراج نص من ملف PDF باستخدام واجهة برمجة تطبيقات تعتمد على Node.js باستخدام مجموعة تطوير برمجيات سحابية تعتمد على Node.js. يوضح البرنامج العملية كاملةً من خلال مشاركة نموذج برمجي لقراءة وعرض نص PDF.
متطلب أساسي
- إنشاء حساب بيانات اعتماد API استخراج النص من ملف PDF
- قم بتنزيل مجموعة أدوات تطوير البرامج السحابية Aspose.PDF لـ Node.js لقراءة ملف PDF
- إعداد مشروع Node.js باستخدام SDK أعلاه لجلب النص
خطوات استخراج نص PDF باستخدام واجهة برمجة تطبيقات Node.js منخفضة الكود
- قم بتكوين PdfApi عن طريق توفير مفتاح التطبيق وSID لقراءة ملف PDF
- قم بتحميل ملف PDF المصدر لاستخراج النص
- استدعاء طريقة الحصول على النص () عند تحميل ملف PDF المصدر بنجاح
- تعيين المنطقة المستطيلة للصفحة التي سيتم جلب النص منها على جميع الصفحات
- تحليل جميع تكرارات النص في استجابة واجهة برمجة التطبيقات وعرض النص
تتضمن هذه الخطوات عملية قراءة نص PDF باستخدام خدمة Node.js RESTful. حمّل ملف PDF إلى وحدة التخزين السحابية، واستدعِ دالة GetText() لجلب جميع تكرارات النص من جميع صفحات ملف PDF المُحمّل، بدءًا من المستطيل المُحدد في الصفحة. استعرض جميع تكرارات النص في الاستجابة، واعرض رقم الصفحة والنص.
كود لاستخراج نص من PDF باستخدام واجهة Node.js REST
يوضح هذا الكود عملية استرجاع نص من ملف PDF باستخدام واجهة Node.js REST. تتكون المنطقة المستطيلة من موضعي x وy السفلي الأيسر وx وy العلوي الأيمن اللذين تريد جلب النص منهما. إذا كنت ترغب في جلب نص من صفحة واحدة، فاستخدم دالة GetPageText() التي تتطلب رقم الصفحة كمعامل إضافي لتحديد الصفحة.
علّمتنا هذه المقالة قراءة ملفات PDF دون الحاجة إلى استخدام أي برنامج قراءة PDF مُثبّت على جهازك. إذا كنت ترغب في حساب عدد كلمات ملف PDF، يُرجى مراجعة المقالة عد الكلمات في مستند PDF باستخدام Node.js REST API.