Εξαγωγή κειμένου από έγγραφο PDF με C# REST API

Αυτό το σύντομο σεμινάριο εξηγεί πώς να εξαγάγετε κείμενο από το έγγραφο PDF με το C# REST API. Θα μάθετε να εξάγετε κείμενο από PDF με C# .NET-based API χρησιμοποιώντας ένα Cloud SDK που βασίζεται σε .NET. Επιδεικνύει την πλήρη διαδικασία κοινοποιώντας ένα δείγμα κώδικα για την ανάγνωση και την εμφάνιση του κειμένου PDF.

Προαπαιτούμενο

Βήματα για την εξαγωγή κειμένου PDF με C# Low Code API

  1. Διαμορφώστε το PdfApi παρέχοντας το κλειδί εφαρμογής και το SID για την ανάγνωση του αρχείου PDF
  2. Ανεβάστε το αρχείο προέλευσης PDF για εξαγωγή του κειμένου
  3. Καλέστε τη μέθοδο GetText() μετά την επιτυχή μεταφόρτωση του αρχείου προέλευσης PDF
  4. Ορίστε την ορθογώνια περιοχή της σελίδας από την οποία θα ληφθεί κείμενο σε όλες τις σελίδες
  5. Αναλύστε όλες τις εμφανίσεις του κειμένου στην απόκριση API και εμφανίστε το κείμενο

Αυτά τα βήματα συνεπάγονται τη διαδικασία ανάγνωσης κειμένου PDF με την υπηρεσία C# RESTful. Φορτώστε το αρχείο PDF στον χώρο αποθήκευσης Cloud και καλέστε τη μέθοδο GetText() για να ανακτήσετε όλες τις εμφανίσεις του κειμένου από όλες τις σελίδες στο φορτωμένο αρχείο PDF από το καθορισμένο ορθογώνιο στη σελίδα. Επαινέστε για όλες τις εμφανίσεις στην απάντηση και εμφάνιση του αριθμού και του κειμένου σελίδας.

Κώδικας για λήψη κειμένου από PDF με διεπαφή C# REST

Αυτός ο κώδικας δείχνει τη διαδικασία ανάκτησης κειμένου από PDF με διεπαφή C# REST. Η ορθογώνια περιοχή αποτελείται από την κάτω αριστερή θέση x και y και την επάνω δεξιά θέση x και y εντός της οποίας θέλετε να ανακτήσετε το κείμενο. Εάν χρειάζεται να ανακτήσετε κείμενο από μία σελίδα, χρησιμοποιήστε τη μέθοδο GetPageText() που απαιτεί έναν αριθμό σελίδας ως πρόσθετο όρισμα για την επιλογή της σελίδας.

Αυτό το άρθρο μας δίδαξε να διαβάζουμε το αρχείο PDF χωρίς να χρησιμοποιούμε λογισμικό ανάγνωσης PDF εγκατεστημένο στο σύστημά σας. Εάν θέλετε να μετρήσετε τον αριθμό των λέξεων σε ένα αρχείο PDF, ανατρέξτε στο άρθρο στο Μετρήστε λέξεις σε έγγραφο PDF με το C# REST API.

 Ελληνικά