Εξαγωγή κειμένου από έγγραφο PDF με το Node.js REST API

Αυτό το σύντομο σεμινάριο εξηγεί πώς να εξαγάγετε κείμενο από το έγγραφο PDF με το Node.js REST API. Θα μάθετε να εξάγετε κείμενο από PDF με το API που βασίζεται στο Node.js χρησιμοποιώντας ένα Cloud SDK που βασίζεται στο Node.js. Επιδεικνύει την πλήρη διαδικασία κοινοποιώντας ένα δείγμα κώδικα για την ανάγνωση και την εμφάνιση του κειμένου PDF.

Προαπαιτούμενο

Βήματα για την εξαγωγή κειμένου PDF με το Node.js Low Code API

  1. Διαμορφώστε το PdfApi παρέχοντας το κλειδί εφαρμογής και το SID για την ανάγνωση του αρχείου PDF
  2. Ανεβάστε το αρχείο προέλευσης PDF για εξαγωγή του κειμένου
  3. Καλέστε τη μέθοδο GetText() μετά την επιτυχή μεταφόρτωση του αρχείου προέλευσης PDF
  4. Ορίστε την ορθογώνια περιοχή της σελίδας από την οποία θα ληφθεί κείμενο σε όλες τις σελίδες
  5. Αναλύστε όλες τις εμφανίσεις του κειμένου στην απόκριση API και εμφανίστε το κείμενο

Αυτά τα βήματα συνεπάγονται τη διαδικασία ανάγνωσης κειμένου PDF με το Node.js RESTful Service. Φορτώστε το αρχείο PDF στον χώρο αποθήκευσης Cloud και καλέστε τη μέθοδο GetText() για να ανακτήσετε όλες τις εμφανίσεις του κειμένου από όλες τις σελίδες στο φορτωμένο αρχείο PDF από το καθορισμένο ορθογώνιο στη σελίδα. Επαινέστε για όλες τις εμφανίσεις στην απάντηση και εμφάνιση του αριθμού και του κειμένου σελίδας.

Κώδικας για λήψη κειμένου από PDF με το Node.js REST Interface

Αυτός ο κώδικας δείχνει τη διαδικασία ανάκτησης κειμένου από PDF με το Node.js REST Interface. Η ορθογώνια περιοχή αποτελείται από την κάτω αριστερή θέση x και y και την επάνω δεξιά θέση x και y εντός της οποίας θέλετε να ανακτήσετε το κείμενο. Εάν χρειάζεται να ανακτήσετε κείμενο από μία σελίδα, χρησιμοποιήστε τη μέθοδο GetPageText() που απαιτεί έναν αριθμό σελίδας ως πρόσθετο όρισμα για την επιλογή της σελίδας.

Αυτό το άρθρο μας δίδαξε να διαβάζουμε το αρχείο PDF χωρίς να χρησιμοποιούμε λογισμικό ανάγνωσης PDF εγκατεστημένο στο σύστημά σας. Εάν θέλετε να μετρήσετε τον αριθμό των λέξεων σε ένα αρχείο PDF, ανατρέξτε στο άρθρο στο Μετρήστε λέξεις σε έγγραφο PDF με το Node.js REST API.

 Ελληνικά