GroupDocs.Parser в двух словах
Document Parser SDK для выполнения высокоточного разбора документов в приложениях Java
Извлечение данных из документов
GroupDocs.Parser for Java API позволяет получать текст, метаданные и изображения из широкого спектра форматов файлов, таких как офисные документы, электронные письма, вложения и архивы. Этот мощный инструмент поможет вам эффективно получать доступ к ценнейшей информации, содержащейся в этих файлах, и обрабатывать её для различных задач, например анализа данных, индексации поисковых систем или систем управления контентом.
Разбор документов
Извлекайте различные элементы, такие как гиперссылки, таблицы, QR‑коды, штрихкоды и данные из PDF‑форм. Также разбирайте любую необходимую информацию из документов с помощью пользовательских шаблонов.
Настройка результатов
Java API позволяет получать данные в различных форматах, таких как необработанный, структурированный, HTML или Markdown. Кроме того, API предоставляет возможность поиска конкретных слов или фраз в тексте документов.

