GroupDocs.Parser на перший погляд
Document Parser SDK для виконання високоточного аналізу документів у застосунках Java
Витягувати дані з документів
API GroupDocs.Parser for Java дозволяє отримувати текст, метадані та зображення з широкого спектру форматів файлів, таких як офісні документи, електронні листи, вкладення та архіви. Цей потужний інструмент допомагає ефективно отримувати доступ і обробляти цінну інформацію, що міститься у цих файлах, для різних застосувань, таких як аналіз даних, індексація пошукових систем або системи управління контентом.
Розбір документів
Видобувайте різні елементи, такі як гіперпосилання, таблиці, QR‑коди, штрих‑коди та дані з PDF‑форм. Також розбирайте будь‑яку потрібну інформацію з документів за допомогою користувацьких шаблонів.
Налаштування результатів
Java API дозволяє отримувати дані у різних форматах, таких як необроблені, структуровані, HTML або Markdown. Крім того, API пропонує функцію пошуку для знаходження окремих слів або фраз у тексті документів.

