यह लेख बताता है कि पायथन REST API का उपयोग करके Word दस्तावेज़ से टेक्स्ट कैसे निकाला जाता है। आप लोड की गई वर्ड फ़ाइल से प्राप्त किए जाने वाले टेक्स्ट के आरंभ और अंत को परिभाषित करके पायथन लो कोड API का उपयोग करके वर्ड फ़ाइल से टेक्स्ट को स्वचालित रूप से निकालना सीखेंगे। आप इस लेख में बताए गए विभिन्न तरीकों से रेंज पैरामीटर सेट कर सकते हैं।
पूर्वापेक्षा
- {{हाइपरलिंक1}}
- किसी Word फ़ाइल से पाठ की एक श्रृंखला निकालने के लिए पायथन के लिए Aspose.Words क्लाउड SDK डाउनलोड करें
- किसी श्रेणी को स्ट्रिंग में सहेजने के लिए उपरोक्त SDK के साथ पायथन समाधान प्रोजेक्ट सेटअप करें
पायथन REST API के साथ वर्ड दस्तावेज़ से विशिष्ट टेक्स्ट निकालने के चरण
- किसी Word फ़ाइल से पाठ की एक श्रृंखला निकालने के लिए WordsApi क्लास ऑब्जेक्ट बनाएँ
- GetRangeTextOnlineRequest ऑब्जेक्ट को इंस्टैंसिएट करें और उसमें इनपुट वर्ड फ़ाइल सामग्री लोड करें
- पाठ श्रेणी के प्रारंभ और अंत को परिभाषित करने के लिए अनुरोध ऑब्जेक्ट में श्रेणी पैरामीटर सेट करें
- पाठ की श्रेणी निकालने के लिए GetRangeTextऑनलाइन विधि को कॉल करें
- API कॉल द्वारा लौटाए गए प्रत्युत्तर से पाठ प्रदर्शित करें
ऊपर दिए गए चरण पाइथन लो कोड एपीआई के साथ DOC से टेक्स्ट निकालने की प्रक्रिया का वर्णन करते हैं। क्लाइंट आईडी और सीक्रेट का उपयोग करके WordsApi क्लास ऑब्जेक्ट बनाकर प्रक्रिया शुरू करें, और GetRangeTextOnlineRequest क्लास का उपयोग करके अनुरोध ऑब्जेक्ट आरंभ करें। टेक्स्ट की श्रेणी निर्धारित करने के लिए पैरामीटर भरें और स्रोत फ़ाइल से डेटा प्राप्त करने वाली GetRangeTextOnline() विधि को कॉल करते समय इसका उपयोग करें।
पायथन REST API के साथ DOCX से टेक्स्ट निकालने का कोड
यह कोड पाइथन REST API का उपयोग करके वर्ड दस्तावेज़ से टेक्स्ट निकालने का तरीका दर्शाता है। GetRangeTextOnlineRequest में RangeStartIdentifier और RangeEndIdentifier पैरामीटर शामिल हैं, जिनका उपयोग उस टेक्स्ट की श्रेणी निर्धारित करने के लिए किया जा सकता है जिसे आप स्ट्रिंग वेरिएबल में प्राप्त और सहेजना चाहते हैं। श्रेणी पहचानकर्ताओं का उपयोग करें, जैसे page3 पृष्ठ संख्या 3 दिखाता है, page3:end पृष्ठ 3 का अंत दिखाता है, और document:end दस्तावेज़ का अंत दिखाता है।
इस लेख में हमने सिखाया है कि पृष्ठों में टेक्स्ट की एक सीमा कैसे निर्धारित करें और उसे एक स्ट्रिंग वेरिएबल में कैसे सेव करें। किसी वर्ड फ़ाइल में किसी पृष्ठ को इमेज में सेव करने के लिए, निम्न लेख देखें: पायथन REST API के साथ वर्ड पेज को इमेज में बदलें.