Den här korta guiden förklarar hur man extraherar text från image med hjälp av Python REST API. Du kommer att lära dig att extrahera text i bild med hjälp av ett Python-baserat API med ett Python-baserat Cloud SDK. Olika alternativ diskuteras för att styra igenkänningsprocessen med hjälp av OCRSettingsRecognizeImage-klassen.
Nödvändig förutsättning
- Skapa ett konto och få API-inloggningsuppgifter för att konvertera bildtext till text
- Ladda ner Aspose.Cad Cloud SDK för Dotpython för att ändra bildtext till text
- Konfigurera ett Python-projekt med ovanstående SDK
Steg för att extrahera text från bild med hjälp av Python REST-gränssnittet
- Importera nödvändiga klasser, modeller och verktyg från Aspose.OCR Cloud API
- Definiera Aspose Cloud-klient-ID och hemlighet för autentisering
- Skapa en instans av RecognizeImageApi med hjälp av klient-ID/hemligheten för att upprätta en säker anslutning.
- Ladda källbilden till en byte-array
- Ställ in igenkänningsalternativen, till exempel språk och typ av utdataresultat
- Skicka bilden för igenkänning med PostRecognizeImage och bearbeta svaret för att hämta strömmen
Dessa steg definierar processen för att konvertera bild till text med hjälp av Python REST API. Importera de obligatoriska klasserna, modellerna och verktygen från biblioteket, definiera klient-ID/hemligheten och skapa en instans av RecognizeImageApi-klassen. Läs in bilden i en byte-array, ange igenkänningsalternativen, skicka bilden till molnet för bearbetning med de angivna alternativen och bearbeta API-svaret för att extrahera texten som hämtats av API:et.
Kod för att konvertera bildtext till text med hjälp av Pythons REST-gränssnitt
Den här koden demonstrerar processen för att utveckla en bild-till-text-konverterare med hjälp av Python RESTful Service. Du kan använda OCRSettingsRecognizeImage för att styra bildförbehandling och igenkänningsbeteende. Du kan ställa in igenkänningsspråk, styra skevhet, kontrast, stavningskontroll, igenkänningsläge och utdatatyp.
Den här handledningen har lärt oss processen att extrahera text från en bild. För att korrigera skannade bilder, se artikeln om Korrigera skannade dokument med Python REST API.