SDK парсинга документов

Удобный для разработчиков SDK парсинга документов для извлечения текста, изображений, штрихкодов, метаданных и таблиц из более чем 50 форматов документов и изображений.

Интегрируйте высокопроизводительный парсинг документов в свои приложения на .NET, Java и Python с минимальными усилиями по написанию кода.

Используйте гибкие шаблоны и расширенные API для настройки правил парсинга и получения чистых, структурированных данных.

GroupDocs.Parser в двух словах

Мощный SDK парсинга документов для извлечения структурированных и неструктурированных данных из PDF, офисных документов, изображений, электронных писем и архивов.

  • Извлечение текста

    Извлечение текстовой информации из различных форматов файлов

  • Извлечение изображений

    Получение визуального контента из различных источников

  • Парсинг данных по шаблонам

    Создавайте пользовательские шаблоны и используйте их для парсинга конкретной информации

  • Парсинг PDF‑форм

    PDF‑формы — это цифровые документы с заполняемыми полями для взаимодействия пользователя

GroupDocs.Parser примеры кода

Некоторые примеры типовых операций GroupDocs.Parser на C#, Java и Python

Как извлечь текст из PDF‑документов

GroupDocs.Parser API упрощает извлечение текста из документов, выполнив несколько шагов.
  // Создайте экземпляр класса Parser, передав нужный файл
  using (var parser = new Parser("source.pdf"))
  {
      // Извлеките текст
      using (var textReader = parser.GetText())
      {
          // Обработайте извлечённый текст
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // Создайте экземпляр класса Parser, передав нужный файл
  try (Parser parser = new Parser("source.pdf"))
  {
      // Извлеките текст
      try (TextReader reader = parser.getText())
      {
          // Обработайте извлечённый текст
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # Создайте экземпляр класса Parser, передав нужный файл
  with Parser("source.pdf") as parser:
      # Извлеките текст
      text = parser.get_text()

      # Обработайте извлечённый текст
      print(text)

Поддерживается более 50 форматов документов и изображений

SDK парсинга документов GroupDocs.Parser позволяет выполнять операции парсинга для офисных документов, PDF, изображений, электронных писем, архивов и многого другого.

Достижения GroupDocs.Parser

Узнайте ключевые показатели достижений нашей библиотеки

  • 50+

    Поддерживаемые форматы

    GroupDocs.Parser поддерживает работу более чем с 50 популярными форматами файлов.

  • 1600k

    Скачивания NuGet

    Пакет GroupDocs.Parser для .NET в NuGet был загружен более 1 600 000 раз.

  • 18k

    Скачивания Maven

    GroupDocs.Parser имеет 18 000 загрузок в Maven. Мощные функции парсинга для Java.

  • 140+

    Довольные клиенты

    Известные компании и отдельные разработчики предпочитают продукты GroupDocs для создания инновационных решений.

Наши довольные клиенты

GroupDocs библиотеки используют всемирно известные и выдающиеся бренды по всему миру.

Независимость от платформы

Библиотека GroupDocs.Parser поддерживает следующие операционные системы и фреймворки:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

Готовы начать?

Попробуйте функции GroupDocs.Parser бесплатно на вашей платформе

Полезные ресурсы

Изучите документацию, примеры кода и раздел поддержки, чтобы улучшить ваш опыт.

Часто задаваемые вопросы

Ответы на самые часто задаваемые вопросы.

  • Требует ли библиотека GroupDocs.Parser какого-либо стороннего программного обеспечения для работы с документами?
    GroupDocs.Parser не требует установки какого-либо внешнего программного обеспечения, такого как Adobe Acrobat, Microsoft Office или другое.
  • Могу ли я попробовать библиотеку GroupDocs.Parser перед её покупкой?
    Да, вы можете попробовать GroupDocs.Parser без покупки лицензии. При установке без лицензии библиотека работает в режиме пробной версии. В этом режиме к полученному документу добавляются ярлыки trial, и он ограничивается первыми 3 страницами. Если вы хотите протестировать GroupDocs.Parser без ограничений пробной версии, вы также можете запросить 30‑дневную временную лицензию. Подробнее см. см..
  • Какие лицензии вы предлагаете?
    Мы предлагаем несколько типов лицензий, соответствующих потребностям конкретных разработчиков или компаний. Типы лицензий зависят от количества разработчиков, количества площадок разработчиков и того, нужно ли предоставлять наш SDK/API конечным клиентам. Кроме того, вы можете выбрать лицензии с оплатой за использование (Metered), основанные на месячном потреблении продукта. Подробнее здесь.

GroupDocs.Parser API парсера документов low‑code

Интегрируйте возможности парсинга документов в любое приложение с помощью нашего облачного REST API и SDK.

GroupDocs.Parser Приложения парсера документов без кода

Веб‑приложения парсера документов, позволяющие извлекать данные из более чем 50 популярных файловых форматов прямо в браузере.

 Русский