Deze korte tutorial legt uit hoe je tekst uit een PDF-document kunt extraheren met de Node.js REST API. Je leert tekst uit een PDF te extraheren met een Node.js-gebaseerde API met behulp van een Node.js-gebaseerde Cloud SDK. Het volledige proces wordt gedemonstreerd door een voorbeeldcode te delen voor het lezen en weergeven van de PDF-tekst.
Voorwaarde
- Maak een account aan API-referenties tekst uit PDF extraheren
- Download Aspose.PDF Cloud SDK voor Node.js om een PDF-bestand te lezen
- Stel een Node.js-project in met de bovenstaande SDK voor het ophalen van tekst
Stappen om PDF-tekst te extraheren met de Node.js Low Code API
- Configureer de PdfApi door de applicatiesleutel en SID op te geven om het PDF-bestand te lezen
- Upload het bron-PDF-bestand om de tekst te extraheren
- Roep de Tekst ophalen()-methode aan na het succesvol uploaden van het bron-PDF-bestand
- Stel het rechthoekige gebied van de pagina in waaruit tekst op alle pagina’s moet worden opgehaald
- Analyseer alle instanties van de tekst in het API-antwoord en geef de tekst weer
Deze stappen omvatten het proces om PDF-tekst te lezen met Node.js RESTful Service. Laad het PDF-bestand in de cloudopslag en roep de GetText()-methode aan om alle exemplaren van de tekst van alle pagina’s in het geladen PDF-bestand op te halen uit de opgegeven rechthoek op de pagina. Doorloop alle exemplaren in de respons en geef het paginanummer en de tekst weer.
Code om tekst uit een PDF te halen met de Node.js REST-interface
Deze code demonstreert het proces om tekst uit een PDF op te halen met de Node.js REST-interface. Het rechthoekige gebied bestaat uit de x- en y-positie linksonder en de x- en y-positie rechtsboven waarbinnen u de tekst wilt ophalen. Als u tekst van één pagina wilt ophalen, gebruikt u de GetPageText()-methode. Deze vereist een paginanummer als extra argument om de pagina te selecteren.
Dit artikel heeft ons geleerd hoe we een PDF-bestand kunnen lezen zonder dat we daarvoor PDF-leessoftware op uw systeem hoeven te installeren. Als u het aantal woorden in een PDF-bestand wilt tellen, raadpleeg dan het artikel op Woorden tellen in een PDF-document met de Node.js REST API.