استخراج متن از سند PDF با API REST جاوا

این آموزش کوتاه نحوه استخراج متن از سند PDF با استفاده از Java REST API را توضیح می‌دهد. شما یاد خواهید گرفت که استخراج متن از PDF را با استفاده از API مبتنی بر جاوا و با استفاده از یک Cloud SDK مبتنی بر جاوا انجام دهید. این آموزش با به اشتراک گذاشتن یک کد نمونه برای خواندن و نمایش متن PDF، فرآیند کامل را نشان می‌دهد.

پیش نیاز

مراحل استخراج متن PDF با API کم کد جاوا

  1. با ارائه کلید برنامه و SID برای خواندن فایل PDF، PdfApi را پیکربندی کنید.
  2. فایل PDF منبع را برای استخراج متن آپلود کنید
  3. پس از آپلود موفقیت‌آمیز فایل PDF منبع، متد دریافت متن () را فراخوانی کنید.
  4. ناحیه مستطیلی صفحه را که متن در تمام صفحات از آن دریافت می‌شود، تنظیم کنید.
  5. تمام موارد تکرار متن در پاسخ API را تجزیه و تحلیل کرده و متن را نمایش می‌دهد.

این مراحل شامل فرآیند خواندن متن PDF با سرویس RESTful جاوا است. فایل PDF را در فضای ذخیره‌سازی ابری بارگذاری کنید و متد GetText() را برای دریافت تمام تکرارهای متن از تمام صفحات فایل PDF بارگذاری شده از مستطیل مشخص شده در صفحه فراخوانی کنید. تمام تکرارها را در پاسخ بررسی کنید و شماره صفحه و متن را نمایش دهید.

کد برای گرفتن متن از PDF با رابط REST جاوا

این کد فرآیند بازیابی متن از PDF با رابط REST جاوا را نشان می‌دهد. ناحیه مستطیلی شامل موقعیت x و y سمت چپ پایین و موقعیت x و y سمت راست بالا است که می‌خواهید متن را در آن دریافت کنید. اگر نیاز به دریافت متن از یک صفحه دارید، از متد GetPageText() استفاده کنید که برای انتخاب صفحه به شماره صفحه به عنوان آرگومان اضافی نیاز دارد.

این مقاله به ما یاد داد که چگونه فایل PDF را بدون استفاده از هیچ نرم‌افزار خواندن PDF نصب شده روی سیستم خود بخوانیم. اگر می‌خواهید تعداد کلمات یک فایل PDF را بشمارید، به مقاله مربوط به شمارش کلمات در سند PDF با استفاده از API REST جاوا مراجعه کنید.

 فارسی