Ten krótki samouczek wyjaśnia, jak wyodrębnić tekst z dokumentu PDF za pomocą interfejsu API REST Node.js. Nauczysz się wyodrębniać tekst z pliku PDF za pomocą interfejsu API opartego na Node.js, korzystając z pakietu SDK w chmurze opartego na Node.js. Prezentuje on cały proces, udostępniając przykładowy kod do odczytu i wyświetlania tekstu w pliku PDF.

Warunek wstępny

Utwórz konto Dane uwierzytelniające API wyodrębnij tekst z pliku PDF
Pobierz Aspose.PDF Cloud SDK dla Node.js, aby przeczytać plik PDF
Skonfiguruj projekt Node.js przy użyciu powyższego zestawu SDK do pobierania tekstu

Kroki wyodrębniania tekstu z pliku PDF za pomocą interfejsu API Node.js Low Code

Skonfiguruj PdfApi, podając klucz aplikacji i SID, aby odczytać plik PDF
Prześlij plik źródłowy PDF, aby wyodrębnić tekst
Wywołaj metodę PobierzTekst() po pomyślnym przesłaniu źródłowego pliku PDF
Ustaw prostokątny obszar strony, z którego ma być pobierany tekst na wszystkich stronach
Przeanalizuj wszystkie wystąpienia tekstu w odpowiedzi API i wyświetl tekst

Te kroki obejmują proces odczytu tekstu PDF za pomocą usługi RESTful Node.js. Załaduj plik PDF do chmury i wywołaj metodę GetText(), aby pobrać wszystkie wystąpienia tekstu ze wszystkich stron załadowanego pliku PDF z określonego prostokąta na stronie. Przejrzyj wszystkie wystąpienia w odpowiedzi i wyświetl numer strony oraz tekst.

Kod do pobierania tekstu z pliku PDF za pomocą interfejsu REST Node.js

Ten kod demonstruje proces pobierania tekstu z pliku PDF za pomocą interfejsu REST Node.js. Prostokątny obszar składa się z pozycji x i y w lewym dolnym rogu oraz pozycji x i y w prawym górnym rogu, z których chcesz pobrać tekst. Aby pobrać tekst z pojedynczej strony, użyj metody GetPageText(), która wymaga numeru strony jako dodatkowego argumentu do jej wybrania.

Ten artykuł pokazał nam, jak odczytać plik PDF bez użycia zainstalowanego w systemie oprogramowania do odczytu plików PDF. Jeśli chcesz policzyć liczbę słów w pliku PDF, zapoznaj się z artykułem Zliczanie słów w dokumencie PDF za pomocą interfejsu API REST Node.js.

Baza wiedzy Aspose.cloud

Znajdź odpowiedzi według API

Wyodrębnij tekst z dokumentu PDF za pomocą interfejsu API REST Node.js

Kroki wyodrębniania tekstu z pliku PDF za pomocą interfejsu API Node.js Low Code

Kod do pobierania tekstu z pliku PDF za pomocą interfejsu REST Node.js