SDK de Analisador de Documentos

SDK de Analisador de Documentos voltado para desenvolvedores, que extrai texto, imagens, códigos de barras, metadados e tabelas de mais de 50 formatos de documentos e imagens.

Integre o parsing de documentos de alto desempenho em suas aplicações .NET, Java e Python com esforço mínimo de codificação.

Use modelos flexíveis e APIs avançadas para personalizar as regras de parsing e gerar saídas de dados claras e estruturadas.

Visão geral de GroupDocs.Parser

Potente SDK de Analisador de Documentos para extrair dados estruturados e não estruturados de PDFs, documentos do Office, imagens, e‑mails e arquivos compactados.

  • Extrair texto

    Extrair informações textuais de vários formatos de arquivo

  • Extrair imagens

    Recuperar conteúdo visual de diversas fontes

  • Analisar dados por meio de modelos

    Crie modelos personalizados e os utilize para analisar informações específicas

  • Analisar Formulários PDF

    Formulários PDF são documentos digitais que apresentam campos preenchíveis para interação do usuário

GroupDocs.Parser exemplos de código

Alguns casos de uso típicos das operações do GroupDocs.Parser em C#, Java e Python

Como extrair texto de documentos PDF

A API GroupDocs.Parser facilita a extração de texto de documentos ao implementar algumas etapas.
  // Crie uma instância da classe Parser passando o arquivo desejado
  using (var parser = new Parser("source.pdf"))
  {
      // Extraia o texto
      using (var textReader = parser.GetText())
      {
          // Processar o texto extraído
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // Crie uma instância da classe Parser passando o arquivo desejado
  try (Parser parser = new Parser("source.pdf"))
  {
      // Extraia o texto
      try (TextReader reader = parser.getText())
      {
          // Processar o texto extraído
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # Crie uma instância da classe Parser passando o arquivo desejado
  with Parser("source.pdf") as parser:
      # Extraia o texto
      text = parser.get_text()

      # Processar o texto extraído
      print(text)

Mais de 50 formatos de documentos e imagens suportados

O SDK de Analisador de Documentos GroupDocs.Parser possibilita operações de parsing em documentos do Office, PDFs, imagens, e‑mails, arquivos compactados e muito mais.

Conquistas do GroupDocs.Parser

Descubra os principais indicadores das realizações da nossa biblioteca

  • 50+

    Formatos suportados

    GroupDocs.Parser suporta operações com mais de 50 formatos de arquivo populares.

  • 1600k

    Downloads do NuGet

    GroupDocs.Parser for .NET NuGet package was downloaded more than 1,600,000 times.

  • 18k

    Downloads do Maven

    GroupDocs.Parser has 18,000 downloads on Maven. Powerful Java Parsing Features.

  • 140+

    Clientes satisfeitos

    Empresas renomadas e desenvolvedores individuais preferem os produtos da GroupDocs para criar soluções inovadoras.

Nossos clientes satisfeitos

GroupDocs bibliotecas são usadas por marcas mundialmente renomadas e distintas em todo o mundo.

Independência de Plataforma

A biblioteca GroupDocs.Parser oferece suporte aos seguintes sistemas operacionais e frameworks:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

Pronto para começar?

Experimente os recursos do GroupDocs.Parser gratuitamente na sua plataforma

Recursos úteis

Explore a documentação, as amostras de código e o apoio da comunidade para aprimorar sua experiência.

Perguntas frequentes

Respostas às perguntas mais frequentes.

  • A biblioteca GroupDocs.Parser precisa de algum outro software de terceiros para manipular documentos?
    GroupDocs.Parser não requer a instalação de nenhum software externo, como Adobe Acrobat, Microsoft Office ou outro.
  • Posso experimentar a biblioteca GroupDocs.Parser antes de comprá‑la?
    Sim, você pode experimentar o GroupDocs.Parser sem comprar uma licença. Quando instalado sem licença, a biblioteca funciona em modo de avaliação. Nesse modo, marcas de avaliação são adicionadas ao documento resultante, e ele é truncado para as primeiras 3 páginas. Se desejar testar o GroupDocs.Parser sem as limitações da versão de avaliação, também pode solicitar uma licença temporária de 30 dias. Para mais detalhes, veja.
  • Quais licenças você tem?
    Oferecemos vários tipos de licença para atender às necessidades de desenvolvedores ou empresas específicas. Os tipos de licença dependem do número de desenvolvedores, do número de locais de site de desenvolvedor e se você precisa disponibilizar nosso SDK/API para seus clientes finais. Como alternativa, você pode escolher licenças por consumo (Metered) baseadas no uso mensal do produto. Saiba mais aqui.
 Português