استخراج النص من مستند PDF باستخدام C# REST API

يوضح هذا البرنامج التعليمي القصير كيفية استخراج نص من مستند PDF باستخدام واجهة برمجة تطبيقات REST بلغة C#. ستتعلم كيفية استخراج نص من ملف PDF باستخدام واجهة برمجة تطبيقات تعتمد على لغة C#.NET باستخدام مجموعة أدوات تطوير برمجيات Cloud تعتمد على لغة NET. ويوضح البرنامج العملية الكاملة من خلال مشاركة رمز عينة لقراءة وعرض نص ملف PDF.

متطلب أساسي

خطوات استخراج نص PDF باستخدام واجهة برمجة التطبيقات C# Low Code

  1. قم بتكوين PdfApi من خلال توفير مفتاح التطبيق وSID لقراءة ملف PDF
  2. قم بتحميل ملف PDF المصدر لاستخراج النص
  3. استدعاء طريقة GetText() عند تحميل ملف PDF المصدر بنجاح
  4. تعيين المنطقة المستطيلة للصفحة التي سيتم جلب النص منها في جميع الصفحات
  5. تحليل جميع تكرارات النص في استجابة واجهة برمجة التطبيقات وعرض النص

تتضمن هذه الخطوات عملية قراءة نص PDF باستخدام خدمة C# RESTful. قم بتحميل ملف PDF إلى وحدة تخزين السحابة واستدع طريقة GetText() لجلب جميع تكرارات النص من جميع الصفحات في ملف PDF المحمل من المستطيل المحدد في الصفحة. قم بالثناء على جميع التكرارات في الاستجابة وعرض رقم الصفحة والنص.

كود لاستخراج نص من PDF باستخدام واجهة C# REST

يوضح هذا الكود عملية استرجاع النص من ملف PDF باستخدام واجهة C# REST. تتكون المنطقة المستطيلة من موضع x وy الأيسر السفلي وموضع x وy الأيمن العلوي الذي تريد استرجاع النص من خلاله. إذا كنت بحاجة إلى استرجاع النص من صفحة واحدة، فاستخدم طريقة GetPageText() التي تتطلب رقم الصفحة كحجة إضافية لتحديد الصفحة.

لقد علمتنا هذه المقالة كيفية قراءة ملف PDF دون استخدام أي برنامج قراءة PDF مثبت على نظامك. إذا كنت تريد حساب عدد الكلمات في ملف PDF، راجع المقالة على حساب الكلمات في مستند PDF باستخدام C# REST API.

 عربي