面向开发者的文档解析 SDK,可从 50 多种文档和图像格式中提取文本、图像、条形码、元数据和表格。
在 .NET、Java 和 Python 应用程序中集成高性能文档解析,代码编写工作量最小化。
使用灵活的模板和高级 API 定制解析规则,并提供干净、结构化的数据输出。
强大的文档解析 SDK,可从 PDF、Office 文档、图像、电子邮件和归档文件中提取结构化和非结构化数据。
从各种文件格式中提取文本信息
从多种来源获取视觉内容
创建自定义模板并利用其解析特定信息
PDF 表单是带有可填写字段的数字文档,用于用户交互
在 C#, Java 和 Python 中的典型 GroupDocs.Parser 操作用例
// 创建 Parser 类的实例并传入所需文件
using (var parser = new Parser("source.pdf"))
{
// 提取文本
using (var textReader = parser.GetText())
{
// 处理提取的文本
Console.WriteLine(textReader?.ReadToEnd());
}
}
// 创建 Parser 类的实例并传入所需文件
try (Parser parser = new Parser("source.pdf"))
{
// 提取文本
try (TextReader reader = parser.getText())
{
// 处理提取的文本
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
from groupdocs.parser import Parser
# 创建 Parser 类的实例并传入所需文件
with Parser("source.pdf") as parser:
# 提取文本
text = parser.get_text()
# 处理提取的文本
print(text)
GroupDocs.Parser 文档解析 SDK 可在 Office 文档、PDF、图像、电子邮件、归档文件等多种类型上执行解析操作。
了解我们库的关键指标和成就
GroupDocs.Parser 支持超过 50 种主流文件格式的操作。
GroupDocs.Parser 的 .NET NuGet 包已下载超过 1,600,000 次。
GroupDocs.Parser 在 Maven 上已下载 18,000 次,具备强大的 Java 解析功能。
知名企业和独立开发者都倾向于使用 GroupDocs 产品构建创新解决方案。
GroupDocs 库被全球知名且卓越的品牌所采用。
GroupDocs.Parser 库支持以下操作系统和框架:
对最常见问题的回答。
使用我们的基于云的 REST API 和 SDK,将文档解析功能集成到任何应用程序中。
cURL 命令用于 RESTful 文档解析云 API,可解析跨多种受支持的流行文件格式的文档。
在您的 Microsoft .NET 应用程序中,提取图像、文本、文档信息,甚至通过用户自定义模板解析任何文档。
面向 Java 开发者的云 SDK,用于在基于 Java 的应用程序中解析文档、提取文档信息和数据。
基于网页的文档解析应用,让您直接在浏览器中从超过 50 种流行文件格式提取数据。