В этом кратком руководстве объясняется, как извлечь текст из документа PDF с помощью Java REST API. Вы научитесь извлекать текст из PDF-файла с помощью Java API, используя Cloud SDK на базе Java. В руководстве продемонстрирован весь процесс с помощью примера кода для чтения и отображения текста PDF-файла.
Необходимое условие
- Создать учетную запись API учетные данные извлечь текст из PDF
- Загрузите Aspose.PDF Cloud SDK для Dotjava, чтобы прочитать PDF-файл
- Настройка проекта Java с указанным выше SDK для извлечения текста
Шаги по извлечению текста из PDF-файла с помощью Java Low Code API
- Настройте PdfApi, указав ключ приложения и SID для чтения PDF-файла.
- Загрузите исходный PDF-файл для извлечения текста.
- Вызовите метод ПолучитьТекст() после успешной загрузки исходного PDF-файла.
- Установите прямоугольную область страницы, из которой будет извлечен текст на всех страницах.
- Проанализировать все вхождения текста в ответе API и отобразить текст
Эти шаги подразумевают процесс чтения текста PDF-файла с помощью Java RESTful Service. Загрузите PDF-файл в облачное хранилище и вызовите метод GetText() для извлечения всех вхождений текста со всех страниц загруженного PDF-файла из указанного прямоугольника на странице. Просмотрите все вхождения в ответе и отобразите номер страницы и текст.
Код для извлечения текста из PDF-файла с помощью интерфейса Java REST
Этот код демонстрирует процесс извлечения текста из PDF-файла с помощью интерфейса Java REST. Прямоугольная область состоит из координат x и y в нижнем левом углу и координат x и y в верхнем правом углу, из которых нужно извлечь текст. Если нужно извлечь текст с одной страницы, используйте метод GetPageText(), который принимает номер страницы в качестве дополнительного аргумента для выбора страницы.
Эта статья научила нас читать PDF-файлы без использования какого-либо программного обеспечения для чтения PDF-файлов, установленного в вашей системе. Если вы хотите подсчитать количество слов в PDF-файле, обратитесь к статье на Подсчет количества слов в PDF-документе с помощью Java REST API.