متن را از سند PDF با C# REST API استخراج کنید

این آموزش کوتاه نحوه استخراج متن از سند PDF با C# REST API را توضیح می دهد. شما یاد خواهید گرفت که متن را از PDF با C#.NET-based API با استفاده از Cloud SDK مبتنی بر NET استخراج کنید. این فرآیند کامل را با به اشتراک گذاری یک کد نمونه برای خواندن و نمایش متن PDF نشان می دهد.

پیش نیاز

مراحل استخراج متن PDF با C# Low Code API

  1. PdfApi را با ارائه کلید برنامه و SID برای خواندن فایل PDF پیکربندی کنید
  2. فایل پی دی اف منبع را برای استخراج متن آپلود کنید
  3. پس از آپلود موفقیت آمیز فایل PDF منبع، روش GetText() را فراخوانی کنید
  4. ناحیه مستطیلی صفحه را که قرار است متن از آن در همه صفحات واکشی شود، تنظیم کنید
  5. تمام موارد تکرار متن در پاسخ API را تجزیه کنید و متن را نمایش دهید

این مراحل مستلزم فرآیند خواندن متن PDF با C# RESTful Service است. فایل پی‌دی‌اف را در فضای ذخیره‌سازی ابری بارگیری کنید و متد GetText() را فراخوانی کنید تا همه موارد تکرار متن از تمام صفحات فایل پی‌دی‌اف بارگذاری‌شده از مستطیل مشخص شده در صفحه واکشی شود. ستایش از طریق تمام اتفاقات در پاسخ و نمایش شماره صفحه و متن.

کد برای گرفتن متن از PDF با رابط C# REST

این کد فرآیند بازیابی متن از PDF با رابط C# REST را نشان می دهد. ناحیه مستطیلی شامل موقعیت x و y سمت چپ پایین و موقعیت x و y سمت راست بالا است که می‌خواهید متن را درون آن واکشی کنید. اگر نیاز به واکشی متن از یک صفحه دارید، از متد GetPageText() استفاده کنید که به شماره صفحه به عنوان آرگومان اضافی برای انتخاب صفحه نیاز دارد.

این مقاله به ما آموزش داده است که فایل پی دی اف را بدون استفاده از نرم افزار خواندن پی دی اف نصب شده روی سیستم خود بخوانیم. اگر می خواهید تعداد کلمات یک فایل PDF را بشمارید، به مقاله شمارش کلمات در سند PDF با C# REST API مراجعه کنید.

 فارسی