GroupDocs.Parser の概要
Java アプリケーションで高精度な文書解析を実行するための Document Parser SDK
文書からデータを抽出
GroupDocs.Parser for Java API を使用すると、Office 文書、メール、添付ファイル、アーカイブなど、幅広いファイル形式からテキスト、メタデータ、画像を取得できます。この強力なツールは、データ分析、検索エンジンのインデックス作成、コンテンツ管理システムなど、さまざまなアプリケーション向けに、これらのファイルに含まれる貴重な情報へ効率的にアクセスし、処理するのに役立ちます。
ドキュメントを解析する
PDF フォームからハイパーリンク、表、QR コード、バーコード、データなどのさまざまな要素を抽出します。また、カスタムテンプレートを使用してドキュメントから任意の情報を解析します。
結果のカスタマイズ
Java API を使用すると、生データ、構造化データ、HTML、Markdown などのさまざまな形式でデータを取得できます。また、API はドキュメントテキスト内の特定の単語やフレーズを検索する機能も提供します。

