यह संक्षिप्त ट्यूटोरियल बताता है कि C# REST API के साथ PDF दस्तावेज़ से टेक्स्ट कैसे निकालें। आप .NET-आधारित क्लाउड SDK का उपयोग करके C# .NET-आधारित API के साथ PDF से टेक्स्ट निकालना सीखेंगे। यह PDF टेक्स्ट को पढ़ने और प्रदर्शित करने के लिए एक नमूना कोड साझा करके पूरी प्रक्रिया को प्रदर्शित करता है।
पूर्वापेक्षा
खाता API क्रेडेंशियल बनाएं PDF से टेक्स्ट निकालें
डाउनलोड करना Aspose.PDF Cloud SDK for Dotnet to read a PDF file
पाठ प्राप्त करने के लिए उपरोक्त SDK के साथ C# प्रोजेक्ट सेटअप करें
C# लो कोड API के साथ PDF टेक्स्ट निकालने के चरण
- पीडीएफ फाइल को पढ़ने के लिए एप्लीकेशन कुंजी और एसआईडी प्रदान करके PdfApi को कॉन्फ़िगर करें
- पाठ निकालने के लिए स्रोत पीडीएफ फ़ाइल अपलोड करें
- स्रोत PDF फ़ाइल के सफलतापूर्वक अपलोड होने पर GetText() विधि को कॉल करें
- पृष्ठ का वह आयताकार क्षेत्र सेट करें जहां से सभी पृष्ठों पर पाठ लाया जाना है
- API प्रतिक्रिया में पाठ की सभी घटनाओं को पार्स करें और पाठ प्रदर्शित करें
इन चरणों में C# RESTful सेवा के साथ PDF पाठ पढ़ने की प्रक्रिया शामिल है। PDF फ़ाइल को क्लाउड स्टोरेज में लोड करें और पृष्ठ पर निर्दिष्ट आयत से लोड की गई PDF फ़ाइल के सभी पृष्ठों से पाठ की सभी घटनाओं को प्राप्त करने के लिए GetText() विधि को कॉल करें। प्रतिक्रिया में सभी घटनाओं की प्रशंसा करें और पृष्ठ संख्या और पाठ प्रदर्शित करें।
C# REST इंटरफ़ेस के साथ PDF से टेक्स्ट प्राप्त करने के लिए कोड
using System; | |
using System.IO; | |
using Aspose.Pdf.Cloud.Sdk.Api; | |
using Aspose.Pdf.Cloud.Sdk.Model; | |
using System.Collections.Generic; | |
namespace Aspose.PDF.Cloud.Examples.Kb | |
{ | |
public class PdfTasks | |
{ | |
public static void ReadPdf() | |
{ | |
PdfApi pdfApi = new PdfApi("APP_KEY", "APP_SID"); | |
String fileName = "TextAndImages.pdf"; | |
try | |
{ | |
// Upload source file | |
FilesUploadResult result = pdfApi.UploadFile(fileName, new MemoryStream(File.ReadAllBytes(fileName))); | |
if (result.Errors.Count == 0) | |
{ | |
TextRectsResponse response = pdfApi.GetText(fileName, 0, 0, 500, 600); | |
foreach(var occurrence in response.TextOccurrences.List) | |
{ | |
Console.WriteLine($"Page:{occurrence.Page} Text:{occurrence.Text}"); | |
} | |
} | |
} | |
catch (Exception ex) | |
{ | |
Console.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace); | |
} | |
} | |
} | |
} |
यह कोड C# REST इंटरफ़ेस के साथ PDF से टेक्स्ट प्राप्त करने की प्रक्रिया को प्रदर्शित करता है। आयताकार क्षेत्र में निचले बाएँ x और y स्थिति और ऊपरी दाएँ x और y स्थिति शामिल है जिसके भीतर आप टेक्स्ट प्राप्त करना चाहते हैं। यदि आपको किसी एक पेज से टेक्स्ट प्राप्त करने की आवश्यकता है, तो GetPageText() विधि का उपयोग करें जिसके लिए पेज का चयन करने के लिए एक अतिरिक्त तर्क के रूप में पेज नंबर की आवश्यकता होती है।
इस लेख में हमने आपको अपने सिस्टम पर इंस्टॉल किए गए किसी भी पीडीएफ रीडिंग सॉफ़्टवेयर का उपयोग किए बिना पीडीएफ फ़ाइल को पढ़ना सिखाया है। यदि आप किसी पीडीएफ फ़ाइल में शब्दों की संख्या गिनना चाहते हैं, तो C# REST API के साथ PDF दस्तावेज़ में शब्दों की गणना करें पर लेख देखें।