این آموزش کوتاه نحوه استخراج متن از سند PDF با استفاده از Java REST API را توضیح میدهد. شما یاد خواهید گرفت که استخراج متن از PDF را با استفاده از API مبتنی بر جاوا و با استفاده از یک Cloud SDK مبتنی بر جاوا انجام دهید. این آموزش با به اشتراک گذاشتن یک کد نمونه برای خواندن و نمایش متن PDF، فرآیند کامل را نشان میدهد.
پیش نیاز
- ایجاد حساب کاربری با استفاده از API استخراج متن از PDF
- برای خواندن فایل PDF، کیت توسعه نرمافزار ابری Aspose.PDF برای داتجاوا را دانلود کنید.
- راهاندازی پروژه جاوا با SDK فوق برای دریافت متن
مراحل استخراج متن PDF با API کم کد جاوا
- با ارائه کلید برنامه و SID برای خواندن فایل PDF، PdfApi را پیکربندی کنید.
- فایل PDF منبع را برای استخراج متن آپلود کنید
- پس از آپلود موفقیتآمیز فایل PDF منبع، متد دریافت متن () را فراخوانی کنید.
- ناحیه مستطیلی صفحه را که متن در تمام صفحات از آن دریافت میشود، تنظیم کنید.
- تمام موارد تکرار متن در پاسخ API را تجزیه و تحلیل کرده و متن را نمایش میدهد.
این مراحل شامل فرآیند خواندن متن PDF با سرویس RESTful جاوا است. فایل PDF را در فضای ذخیرهسازی ابری بارگذاری کنید و متد GetText() را برای دریافت تمام تکرارهای متن از تمام صفحات فایل PDF بارگذاری شده از مستطیل مشخص شده در صفحه فراخوانی کنید. تمام تکرارها را در پاسخ بررسی کنید و شماره صفحه و متن را نمایش دهید.
کد برای گرفتن متن از PDF با رابط REST جاوا
این کد فرآیند بازیابی متن از PDF با رابط REST جاوا را نشان میدهد. ناحیه مستطیلی شامل موقعیت x و y سمت چپ پایین و موقعیت x و y سمت راست بالا است که میخواهید متن را در آن دریافت کنید. اگر نیاز به دریافت متن از یک صفحه دارید، از متد GetPageText() استفاده کنید که برای انتخاب صفحه به شماره صفحه به عنوان آرگومان اضافی نیاز دارد.
این مقاله به ما یاد داد که چگونه فایل PDF را بدون استفاده از هیچ نرمافزار خواندن PDF نصب شده روی سیستم خود بخوانیم. اگر میخواهید تعداد کلمات یک فایل PDF را بشمارید، به مقاله مربوط به شمارش کلمات در سند PDF با استفاده از API REST جاوا مراجعه کنید.