यह संक्षिप्त ट्यूटोरियल बताता है कि C# REST API के साथ PDF दस्तावेज़ से टेक्स्ट कैसे निकालें। आप .NET-आधारित क्लाउड SDK का उपयोग करके C# .NET-आधारित API के साथ PDF से टेक्स्ट निकालना सीखेंगे। यह PDF टेक्स्ट को पढ़ने और प्रदर्शित करने के लिए एक नमूना कोड साझा करके पूरी प्रक्रिया को प्रदर्शित करता है।
पूर्वापेक्षा
खाता API क्रेडेंशियल बनाएं PDF से टेक्स्ट निकालें
डाउनलोड करना Aspose.PDF Cloud SDK for Dotnet to read a PDF file
पाठ प्राप्त करने के लिए उपरोक्त SDK के साथ C# प्रोजेक्ट सेटअप करें
C# लो कोड API के साथ PDF टेक्स्ट निकालने के चरण
- पीडीएफ फाइल को पढ़ने के लिए एप्लीकेशन कुंजी और एसआईडी प्रदान करके PdfApi को कॉन्फ़िगर करें
- पाठ निकालने के लिए स्रोत पीडीएफ फ़ाइल अपलोड करें
- स्रोत PDF फ़ाइल के सफलतापूर्वक अपलोड होने पर GetText() विधि को कॉल करें
- पृष्ठ का वह आयताकार क्षेत्र सेट करें जहां से सभी पृष्ठों पर पाठ लाया जाना है
- API प्रतिक्रिया में पाठ की सभी घटनाओं को पार्स करें और पाठ प्रदर्शित करें
इन चरणों में C# RESTful सेवा के साथ PDF पाठ पढ़ने की प्रक्रिया शामिल है। PDF फ़ाइल को क्लाउड स्टोरेज में लोड करें और पृष्ठ पर निर्दिष्ट आयत से लोड की गई PDF फ़ाइल के सभी पृष्ठों से पाठ की सभी घटनाओं को प्राप्त करने के लिए GetText() विधि को कॉल करें। प्रतिक्रिया में सभी घटनाओं की प्रशंसा करें और पृष्ठ संख्या और पाठ प्रदर्शित करें।
C# REST इंटरफ़ेस के साथ PDF से टेक्स्ट प्राप्त करने के लिए कोड
यह कोड C# REST इंटरफ़ेस के साथ PDF से टेक्स्ट प्राप्त करने की प्रक्रिया को प्रदर्शित करता है। आयताकार क्षेत्र में निचले बाएँ x और y स्थिति और ऊपरी दाएँ x और y स्थिति शामिल है जिसके भीतर आप टेक्स्ट प्राप्त करना चाहते हैं। यदि आपको किसी एक पेज से टेक्स्ट प्राप्त करने की आवश्यकता है, तो GetPageText() विधि का उपयोग करें जिसके लिए पेज का चयन करने के लिए एक अतिरिक्त तर्क के रूप में पेज नंबर की आवश्यकता होती है।
इस लेख में हमने आपको अपने सिस्टम पर इंस्टॉल किए गए किसी भी पीडीएफ रीडिंग सॉफ़्टवेयर का उपयोग किए बिना पीडीएफ फ़ाइल को पढ़ना सिखाया है। यदि आप किसी पीडीएफ फ़ाइल में शब्दों की संख्या गिनना चाहते हैं, तो C# REST API के साथ PDF दस्तावेज़ में शब्दों की गणना करें पर लेख देखें।