استخراج النص من مستند Word باستخدام Nodej.s REST API

يرشدك هذا المقال إلى كيفية استخراج نص من مستند Word باستخدام واجهة برمجة تطبيقات Nodej.s REST. ستتعلم كيفية استخراج النص تلقائيًا من ملف Word باستخدام واجهة برمجة تطبيقات Nodej.s منخفضة الكود من خلال تحديد بداية ونهاية النص الذي تريد جلبه من ملف Word المُحمّل. يمكنك ضبط معلمات النطاق بطرق مختلفة موضحة في هذه المقالة.

متطلب أساسي

خطوات استخراج نص محدد من مستند Word باستخدام Nodej.s REST API

  1. إنشاء كائن فئة WordsApi لاستخراج نطاق من النص من ملف Word
  2. إنشاء كائن GetRangeTextOnlineRequest وتحميل محتوى ملف Word المدخل فيه
  3. تعيين معلمات النطاق في كائن الطلب لتحديد بداية ونهاية نطاق النص
  4. اتصل بطريقة احصل على نص النطاق عبر الإنترنت لاستخراج نطاق النص
  5. عرض النص من الاستجابة التي تم إرجاعها بواسطة استدعاء API

تصف الخطوات المذكورة أعلاه عملية استخراج نص من مستند DOC باستخدام واجهة برمجة تطبيقات Nodej.s منخفضة الكود. ابدأ العملية بإنشاء كائن فئة WordsApi باستخدام معرف العميل والرمز السري، ثم ابدأ كائن الطلب باستخدام فئة GetRangeTextOnlineRequest. أدخل المعلمات لتحديد نطاق النص، واستخدمها عند استدعاء دالة GetRangeTextOnline() التي تجلب البيانات من ملف المصدر.

كود لاستخراج النص من DOCX باستخدام Nodej.s REST API

يوضح هذا الكود كيفية استخراج نص من مستند Word باستخدام واجهة برمجة تطبيقات REST الخاصة بـ Nodej.s. يحتوي GetRangeTextOnlineRequest على المعلمتين RangeStartIdentifier وRangeEndIdentifier، واللتين يمكن استخدامهما لتحديد نطاق النص الذي تريد جلبه وحفظه في متغير سلسلة نصية. استخدم معرفات النطاق مثل page3 لعرض رقم الصفحة 3، وpage3:end لعرض نهاية الصفحة 3، وdocument:end لعرض نهاية المستند.

علّمتنا هذه المقالة كيفية تحديد نطاق نصي عبر الصفحات وحفظه في متغير نصي. لحفظ صفحة في ملف وورد إلى صورة، راجع المقالة التالية: تحويل صفحة Word إلى صورة باستخدام Nodej.s REST API.

 عربي