استخراج متن از سند PDF با Node.js REST API

این آموزش کوتاه نحوه استخراج متن از سند PDF با Node.js REST API را توضیح می دهد. شما یاد خواهید گرفت که متن را از PDF با API مبتنی بر Node.js با استفاده از یک Cloud SDK مبتنی بر Node.js استخراج کنید. این فرآیند کامل را با به اشتراک گذاری یک کد نمونه برای خواندن و نمایش متن PDF نشان می دهد.

پیش نیاز

مراحل استخراج متن PDF با Node.js Low Code API

  1. PdfApi را با ارائه کلید برنامه و SID برای خواندن فایل PDF پیکربندی کنید
  2. فایل پی دی اف منبع را برای استخراج متن آپلود کنید
  3. پس از آپلود موفقیت آمیز فایل PDF منبع، روش GetText() را فراخوانی کنید
  4. ناحیه مستطیلی صفحه را که قرار است متن از آن در همه صفحات واکشی شود، تنظیم کنید
  5. تمام موارد تکرار متن در پاسخ API را تجزیه کنید و متن را نمایش دهید

این مراحل مستلزم فرآیند خواندن متن PDF با Node.js RESTful Service است. فایل پی‌دی‌اف را در فضای ذخیره‌سازی ابری بارگیری کنید و متد GetText() را فراخوانی کنید تا همه موارد تکرار متن از تمام صفحات موجود در فایل PDF بارگذاری شده از مستطیل مشخص شده در صفحه واکشی شود. ستایش از طریق تمام اتفاقات در پاسخ و نمایش شماره صفحه و متن.

کد برای گرفتن متن از PDF با رابط Node.js REST

این کد روند بازیابی متن از PDF با Node.js REST Interface را نشان می دهد. ناحیه مستطیلی شامل موقعیت x و y سمت چپ پایین و موقعیت x و y سمت راست بالا است که می‌خواهید متن را درون آن واکشی کنید. اگر نیاز به واکشی متن از یک صفحه دارید، از متد GetPageText() استفاده کنید که به شماره صفحه به عنوان آرگومان اضافی برای انتخاب صفحه نیاز دارد.

این مقاله به ما آموزش داده است که فایل پی دی اف را بدون استفاده از نرم افزار خواندن پی دی اف نصب شده روی سیستم خود بخوانیم. اگر می خواهید تعداد کلمات یک فایل PDF را بشمارید به مقاله با Node.js REST API کلمات را در سند PDF بشمارید مراجعه کنید.

 فارسی