يرشدك هذا المقال إلى كيفية استخراج نص من مستند Word باستخدام واجهة برمجة تطبيقات Python REST. ستتعلم كيفية استخراج النص تلقائيًا من ملف Word باستخدام واجهة برمجة تطبيقات Python منخفضة الكود من خلال تحديد بداية ونهاية النص الذي تريد جلبه من ملف Word المُحمّل. يمكنك ضبط معلمات النطاق بطرق مختلفة موضحة في هذه المقالة.
متطلب أساسي
- {{الرابط التشعبي 1}}
- قم بتنزيل مجموعة أدوات تطوير البرامج السحابية Aspose.Words للغة Python لاستخراج نطاق من النص من ملف Word
- إعداد مشروع حل Python باستخدام SDK أعلاه لحفظ نطاق في سلسلة
خطوات استخراج نص معين من مستند Word باستخدام Python REST API
- إنشاء كائن فئة WordsApi لاستخراج نطاق من النص من ملف Word
- إنشاء كائن GetRangeTextOnlineRequest وتحميل محتوى ملف Word المدخل فيه
- تعيين معلمات النطاق في كائن الطلب لتحديد بداية ونهاية نطاق النص
- اتصل بطريقة احصل على نص النطاق عبر الإنترنت لاستخراج نطاق النص
- عرض النص من الاستجابة التي تم إرجاعها بواسطة استدعاء API
تصف الخطوات المذكورة أعلاه عملية استخراج نص من DOC باستخدام واجهة برمجة تطبيقات Python منخفضة الكود. ابدأ العملية بإنشاء كائن فئة WordsApi باستخدام معرف العميل والرمز السري، ثم ابدأ كائن الطلب باستخدام فئة GetRangeTextOnlineRequest. أدخل المعلمات لتحديد نطاق النص، واستخدمها عند استدعاء دالة GetRangeTextOnline() التي تجلب البيانات من ملف المصدر.
كود لاستخراج النص من DOCX باستخدام Python REST API
يوضح هذا الكود كيفية استخراج نص من مستند Word باستخدام واجهة برمجة تطبيقات Python REST. يحتوي GetRangeTextOnlineRequest على المعلمتين RangeStartIdentifier وRangeEndIdentifier، واللتين يمكن استخدامهما لتحديد نطاق النص الذي تريد جلبه وحفظه في متغير سلسلة نصية. استخدم معرفات النطاق مثل page3 لعرض رقم الصفحة 3، وpage3:end لعرض نهاية الصفحة 3، وdocument:end لعرض نهاية المستند.
علّمتنا هذه المقالة كيفية تحديد نطاق نصي عبر الصفحات وحفظه في متغير نصي. لحفظ صفحة في ملف وورد إلى صورة، راجع المقالة التالية: تحويل صفحة Word إلى صورة باستخدام Python REST API.