C# REST API के साथ PDF दस्तावेज़ से टेक्स्ट निकालें

यह संक्षिप्त ट्यूटोरियल बताता है कि C# REST API के साथ PDF दस्तावेज़ से टेक्स्ट कैसे निकालें। आप .NET-आधारित क्लाउड SDK का उपयोग करके C# .NET-आधारित API के साथ PDF से टेक्स्ट निकालना सीखेंगे। यह PDF टेक्स्ट को पढ़ने और प्रदर्शित करने के लिए एक नमूना कोड साझा करके पूरी प्रक्रिया को प्रदर्शित करता है।

पूर्वापेक्षा

C# लो कोड API के साथ PDF टेक्स्ट निकालने के चरण

  1. पीडीएफ फाइल को पढ़ने के लिए एप्लीकेशन कुंजी और एसआईडी प्रदान करके PdfApi को कॉन्फ़िगर करें
  2. पाठ निकालने के लिए स्रोत पीडीएफ फ़ाइल अपलोड करें
  3. स्रोत PDF फ़ाइल के सफलतापूर्वक अपलोड होने पर GetText() विधि को कॉल करें
  4. पृष्ठ का वह आयताकार क्षेत्र सेट करें जहां से सभी पृष्ठों पर पाठ लाया जाना है
  5. API प्रतिक्रिया में पाठ की सभी घटनाओं को पार्स करें और पाठ प्रदर्शित करें

इन चरणों में C# RESTful सेवा के साथ PDF पाठ पढ़ने की प्रक्रिया शामिल है। PDF फ़ाइल को क्लाउड स्टोरेज में लोड करें और पृष्ठ पर निर्दिष्ट आयत से लोड की गई PDF फ़ाइल के सभी पृष्ठों से पाठ की सभी घटनाओं को प्राप्त करने के लिए GetText() विधि को कॉल करें। प्रतिक्रिया में सभी घटनाओं की प्रशंसा करें और पृष्ठ संख्या और पाठ प्रदर्शित करें।

C# REST इंटरफ़ेस के साथ PDF से टेक्स्ट प्राप्त करने के लिए कोड

using System;
using System.IO;
using Aspose.Pdf.Cloud.Sdk.Api;
using Aspose.Pdf.Cloud.Sdk.Model;
using System.Collections.Generic;
namespace Aspose.PDF.Cloud.Examples.Kb
{
public class PdfTasks
{
public static void ReadPdf()
{
PdfApi pdfApi = new PdfApi("APP_KEY", "APP_SID");
String fileName = "TextAndImages.pdf";
try
{
// Upload source file
FilesUploadResult result = pdfApi.UploadFile(fileName, new MemoryStream(File.ReadAllBytes(fileName)));
if (result.Errors.Count == 0)
{
TextRectsResponse response = pdfApi.GetText(fileName, 0, 0, 500, 600);
foreach(var occurrence in response.TextOccurrences.List)
{
Console.WriteLine($"Page:{occurrence.Page} Text:{occurrence.Text}");
}
}
}
catch (Exception ex)
{
Console.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
}
}
}

यह कोड C# REST इंटरफ़ेस के साथ PDF से टेक्स्ट प्राप्त करने की प्रक्रिया को प्रदर्शित करता है। आयताकार क्षेत्र में निचले बाएँ x और y स्थिति और ऊपरी दाएँ x और y स्थिति शामिल है जिसके भीतर आप टेक्स्ट प्राप्त करना चाहते हैं। यदि आपको किसी एक पेज से टेक्स्ट प्राप्त करने की आवश्यकता है, तो GetPageText() विधि का उपयोग करें जिसके लिए पेज का चयन करने के लिए एक अतिरिक्त तर्क के रूप में पेज नंबर की आवश्यकता होती है।

इस लेख में हमने आपको अपने सिस्टम पर इंस्टॉल किए गए किसी भी पीडीएफ रीडिंग सॉफ़्टवेयर का उपयोग किए बिना पीडीएफ फ़ाइल को पढ़ना सिखाया है। यदि आप किसी पीडीएफ फ़ाइल में शब्दों की संख्या गिनना चाहते हैं, तो C# REST API के साथ PDF दस्तावेज़ में शब्दों की गणना करें पर लेख देखें।

 हिन्दी