文档解析 SDK

面向开发者的文档解析 SDK,可从 50 多种文档和图像格式中提取文本、图像、条形码、元数据和表格。

在 .NET、Java 和 Python 应用程序中集成高性能文档解析,代码编写工作量最小化。

使用灵活的模板和高级 API 定制解析规则,并提供干净、结构化的数据输出。

GroupDocs.Parser 一览

强大的文档解析 SDK,可从 PDF、Office 文档、图像、电子邮件和归档文件中提取结构化和非结构化数据。

  • 提取文本

    从各种文件格式中提取文本信息

  • 提取图像

    从多种来源获取视觉内容

  • 通过模板解析数据

    创建自定义模板并利用其解析特定信息

  • 解析 PDF 表单

    PDF 表单是带有可填写字段的数字文档,用于用户交互

GroupDocs.Parser 代码示例

在 C#, Java 和 Python 中的典型 GroupDocs.Parser 操作用例

如何从 PDF 文档中提取文本

GroupDocs.Parser API 通过几个步骤即可轻松从文档中提取文本。
  // 创建 Parser 类的实例并传入所需文件
  using (var parser = new Parser("source.pdf"))
  {
      // 提取文本
      using (var textReader = parser.GetText())
      {
          // 处理提取的文本
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // 创建 Parser 类的实例并传入所需文件
  try (Parser parser = new Parser("source.pdf"))
  {
      // 提取文本
      try (TextReader reader = parser.getText())
      {
          // 处理提取的文本
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # 创建 Parser 类的实例并传入所需文件
  with Parser("source.pdf") as parser:
      # 提取文本
      text = parser.get_text()

      # 处理提取的文本
      print(text)

支持 50 多种文档和图像格式

GroupDocs.Parser 文档解析 SDK 可在 Office 文档、PDF、图像、电子邮件、归档文件等多种类型上执行解析操作。

GroupDocs.Parser 成就

了解我们库的关键指标和成就

  • 50+

    支持的格式

    GroupDocs.Parser 支持超过 50 种主流文件格式的操作。

  • 1600k

    NuGet 下载量

    GroupDocs.Parser 的 .NET NuGet 包已下载超过 1,600,000 次。

  • 18k

    Maven 下载量

    GroupDocs.Parser 在 Maven 上已下载 18,000 次,具备强大的 Java 解析功能。

  • 140+

    满意的客户

    知名企业和独立开发者都倾向于使用 GroupDocs 产品构建创新解决方案。

我们的满意客户

GroupDocs 库被全球知名且卓越的品牌所采用。

平台独立性

GroupDocs.Parser 库支持以下操作系统和框架:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

准备开始了吗?

在您的平台上免费试用 GroupDocs.Parser 功能

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

常见问题

对最常见问题的回答。

  • GroupDocs.Parser 库是否需要其他第三方软件来处理文档?
    GroupDocs.Parser 不需要安装任何外部软件,例如 Adobe Acrobat、Microsoft Office 或其他软件。
  • 我可以在购买前试用 GroupDocs.Parser 库吗?
    是的,您可以在不购买许可证的情况下试用 GroupDocs.Parser。未授权安装后,库将以试用模式运行。在此模式下,生成的文档会添加试用徽章,并截取前 3 页。如果您希望在不受试用版限制的情况下测试 GroupDocs.Parser,还可以申请 30 天的临时许可证。更多详情,请查看
  • 您提供哪些许可证?
    我们提供多种许可证类型,以满足特定开发者或公司的需求。许可证类型取决于开发者人数、开发者站点位置数量,以及是否需要向最终客户交付我们的 SDK/API。您也可以根据产品的月度使用量选择计量许可证。了解更多信息,请点击此处
 中国人