SDK парсера документів

Зручний для розробників SDK парсера документів для витягування тексту, зображень, штрих-кодів, метаданих та таблиць з понад 50 форматів документів і зображень.

Інтегруйте високопродуктивний парсинг документів у ваші .NET, Java та Python додатки з мінімальними зусиллями кодування.

Використовуйте гнучкі шаблони та розширені API для налаштування правил парсингу та отримання чистих, структурованих даних.

Оберіть вашу платформу

GroupDocs.Parser на перший погляд

Потужний SDK парсера документів для витягування структурованих та неструктурованих даних з PDF, Office документів, зображень, електронних листів та архівів.

Витягування тексту
Витягування текстової інформації з різних форматів файлів
Витягування зображень
Отримання візуального вмісту з різних джерел
Парсинг даних за шаблонами
Створюйте власні шаблони та використовуйте їх для парсингу конкретної інформації
Парсинг PDF форм
PDF‑форми — це цифрові документи з полями, які можна заповнювати, для взаємодії користувача

GroupDocs.Parser зразки коду

Деякі випадки використання типових операцій GroupDocs.Parser на C#, Java та Python

Як витягнути текст з PDF‑документів

GroupDocs.Parser API полегшує витягнення тексту з документів, виконавши кілька кроків.

C# Java Python

  // Створіть екземпляр класу Parser, передаючи потрібний файл
  using (var parser = new Parser("source.pdf"))
  {
      // Витягніть текст
      using (var textReader = parser.GetText())
      {
          // Обробіть витягнутий текст
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }

  // Створіть екземпляр класу Parser, передаючи потрібний файл
  try (Parser parser = new Parser("source.pdf"))
  {
      // Витягніть текст
      try (TextReader reader = parser.getText())
      {
          // Обробіть витягнутий текст
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }

  from groupdocs.parser import Parser

  # Створіть екземпляр класу Parser, передаючи потрібний файл
  with Parser("source.pdf") as parser:
      # Витягніть текст
      text = parser.get_text()

      # Обробіть витягнутий текст
      print(text)

GroupDocs.Parser досягнення

Дізнайтеся про ключові метрики досягнень нашої бібліотеки

50+
Підтримувані формати
GroupDocs.Parser підтримує операції з більш ніж 50 популярними форматами файлів.
1600k
Завантаження з NuGet
GroupDocs.Parser для .NET пакету NuGet було завантажено понад 1 600 000 разів.
18k
Завантаження з Maven
GroupDocs.Parser має 18 000 завантажень на Maven. Потужні функції парсингу для Java.
140+
Щасливі клієнти
Відомі компанії та окремі розробники надають перевагу продуктам GroupDocs для створення інноваційних рішень.

Наші щасливі клієнти

GroupDocs бібліотеки використовуються провідними та відомими брендами по всьому світу.

Платформна незалежність

GroupDocs.Parser бібліотека підтримує наступні операційні системи та фреймворки:

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher

Windows
Linux
Mac OS

Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code

50+ file formats

Java 8 or higher
Kotlin

Windows
Linux
Mac OS

IntelliJ IDEA
Eclipse
NetBeans

50+ file formats

Python 3.5+

Windows
Linux
macOS

PyCharm, VS Code, Jupyter Notebook

50+ file formats

Готові розпочати?

Спробуйте функції GroupDocs.Parser безкоштовно на вашій платформі

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Документація

Посилання API

Зразки коду

Безкоштовна підтримка

Оплачувана підтримка

Часто задавані питання

Відповіді на найчастіші запитання.

Чи потребує бібліотека GroupDocs.Parser якого‑небудь стороннього ПЗ для обробки документів?
GroupDocs.Parser не вимагає встановлення жодного стороннього ПЗ, такого як Adobe Acrobat, Microsoft Office або будь‑яке інше.
Чи можу я спробувати бібліотеку GroupDocs.Parser перед її придбанням?
Так, ви можете випробувати GroupDocs.Parser без придбання ліцензії. Після встановлення без ліцензії бібліотека працює в режимі пробної версії. У цьому режимі до результуючого документа додаються позначки trial, і він обрізається до перших 3‑х сторінок. Якщо ви бажаєте протестувати GroupDocs.Parser без обмежень пробної версії, ви також можете запросити 30‑денну тимчасову ліцензію. Для отримання додаткової інформації, дивіться.
Які ліцензії ви пропонуєте?
Ми пропонуємо кілька типів ліцензій, що відповідають потребам конкретних розробників або компаній. Типи ліцензій залежать від кількості розробників, кількості розташувань сайтів розробників та того, чи потрібно вам надавати наш SDK/API кінцевим користувачам. Альтернативно, ви можете обрати порахункові (Metered) ліцензії на основі місячного використання продукту. Дізнайтеся більше тут.

GroupDocs.Parser low‑code API парсера документів

Вбудуйте можливості парсингу документів у будь‑який застосунок за допомогою нашого хмарного REST API та SDK.

GroupDocs.Parser Cloud for cURL

cURL‑команди для RESTful хмарного API парсера документів, що дозволяють аналізувати документи у широкому спектрі підтримуваних популярних форматів файлів.

GroupDocs.Parser Cloud for .NET

Витягайте зображення, текст, інформацію про документ або навіть парсьте будь‑який документ за допомогою шаблону, визначеного користувачем, у ваших Microsoft .NET застосунках.

GroupDocs.Parser Cloud for Java

Хмарний SDK для розробників Java, щоб парсити документи, витягати інформацію про документ та дані у Java‑застосунках.

GroupDocs.Parser Document Parser додатки без коду

Веб‑додатки парсера документів, які дозволяють витягати дані з більш ніж 50 популярних форматів файлів безпосередньо у вашому браузері.

SDK парсера документів

Оберіть вашу платформу

.NET

Java

Python

GroupDocs.Parser на перший погляд

Витягування тексту

Витягування зображень

Парсинг даних за шаблонами

Парсинг PDF форм

GroupDocs.Parser зразки коду

Як витягнути текст з PDF‑документів

GroupDocs.Parser досягнення

Підтримувані формати

Завантаження з NuGet

Завантаження з Maven

Щасливі клієнти

Наші щасливі клієнти

Платформна незалежність

.NET

Java

Python

Готові розпочати?

Корисні ресурси

Часто задавані питання

GroupDocs.Parser low‑code API парсера документів

GroupDocs.Parser Cloud for cURL

GroupDocs.Parser Cloud for .NET

GroupDocs.Parser Cloud for Java

GroupDocs.Parser Document Parser додатки без коду

GroupDocs.Parser Total

GroupDocs.Parser DOCX

GroupDocs.Parser PDF

SDK парсера документів

Оберіть вашу платформу

.NET

Java

Python

GroupDocs.Parser на перший погляд

Витягування тексту

Витягування зображень

Парсинг даних за шаблонами

Парсинг PDF форм

GroupDocs.Parser зразки коду

Як витягнути текст з PDF‑документів

Підтримується більш ніж 50 форматів документів і зображень

GroupDocs.Parser досягнення

Підтримувані формати

Завантаження з NuGet

Завантаження з Maven

Щасливі клієнти

Наші щасливі клієнти

Платформна незалежність

.NET

Java

Python

Готові розпочати?

Корисні ресурси

Часто задавані питання

GroupDocs.Parser low‑code API парсера документів

GroupDocs.Parser Cloud for cURL

GroupDocs.Parser Cloud for .NET

GroupDocs.Parser Cloud for Java

GroupDocs.Parser Document Parser додатки без коду

GroupDocs.Parser Total

GroupDocs.Parser DOCX

GroupDocs.Parser PDF