Ištraukite tekstą iš PDF dokumento naudodami C# REST API

Šioje trumpoje pamokoje paaiškinama, kaip ištraukti tekstą iš PDF dokumento naudojant C# REST API. Išmoksite ištraukti tekstą iš PDF su C# .NET pagrįstu API naudodami .NET pagrindu sukurtą debesies SDK. Jame demonstruojamas visas procesas, bendrinant pavyzdinį kodą, skirtą skaityti ir rodyti PDF tekstą.

Būtina sąlyga

Veiksmai, kaip ištraukti PDF tekstą naudojant C# Low Code API

  1. Konfigūruokite PdfApi pateikdami programos raktą ir SID, kad galėtumėte skaityti PDF failą
  2. Įkelkite šaltinio PDF failą, kad ištrauktumėte tekstą
  3. Sėkmingai įkėlus šaltinio PDF failą, iškvieskite metodą GetText()
  4. Nustatykite stačiakampę puslapio sritį, iš kurios turi būti paimtas tekstas visuose puslapiuose
  5. Išnagrinėkite visus API atsakymo teksto atvejus ir parodykite tekstą

Šie veiksmai apima * PDF teksto skaitymo procesą naudojant C# RESTful Service*. Įkelkite PDF failą į debesies saugyklą ir iškvieskite GetText() metodą, kad gautumėte visus teksto atvejus iš visų įkelto PDF failo puslapių iš nurodyto puslapio stačiakampio. Pagirkite visus atsakymų atvejus ir parodykite puslapio numerį bei tekstą.

Kodas, skirtas paimti tekstą iš PDF su C# REST sąsaja

Šis kodas parodo procesą, kaip gauti tekstą iš PDF naudojant C# REST sąsają. Stačiakampę sritį sudaro apatinė kairioji x ir y padėtis bei viršutinė dešinė x ir y padėtis, kurioje norite gauti tekstą. Jei reikia gauti tekstą iš vieno puslapio, naudokite GetPageText() metodą, kuriam norint pasirinkti puslapį reikalingas puslapio numeris kaip papildomas argumentas.

Šis straipsnis mus išmokė skaityti PDF failą nenaudojant jokios jūsų sistemoje įdiegtos PDF skaitymo programinės įrangos. Jei norite suskaičiuoti žodžių skaičių PDF faile, žr. straipsnį Suskaičiuokite žodžius PDF dokumente naudodami C# REST API.

 Latviski