SDK парсера документів

Зручний для розробників SDK парсера документів для витягування тексту, зображень, штрих-кодів, метаданих та таблиць з понад 50 форматів документів і зображень.

Інтегруйте високопродуктивний парсинг документів у ваші .NET, Java та Python додатки з мінімальними зусиллями кодування.

Використовуйте гнучкі шаблони та розширені API для налаштування правил парсингу та отримання чистих, структурованих даних.

GroupDocs.Parser на перший погляд

Потужний SDK парсера документів для витягування структурованих та неструктурованих даних з PDF, Office документів, зображень, електронних листів та архівів.

  • Витягування тексту

    Витягування текстової інформації з різних форматів файлів

  • Витягування зображень

    Отримання візуального вмісту з різних джерел

  • Парсинг даних за шаблонами

    Створюйте власні шаблони та використовуйте їх для парсингу конкретної інформації

  • Парсинг PDF форм

    PDF‑форми — це цифрові документи з полями, які можна заповнювати, для взаємодії користувача

GroupDocs.Parser зразки коду

Деякі випадки використання типових операцій GroupDocs.Parser на C#, Java та Python

Як витягнути текст з PDF‑документів

GroupDocs.Parser API полегшує витягнення тексту з документів, виконавши кілька кроків.
  // Створіть екземпляр класу Parser, передаючи потрібний файл
  using (var parser = new Parser("source.pdf"))
  {
      // Витягніть текст
      using (var textReader = parser.GetText())
      {
          // Обробіть витягнутий текст
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // Створіть екземпляр класу Parser, передаючи потрібний файл
  try (Parser parser = new Parser("source.pdf"))
  {
      // Витягніть текст
      try (TextReader reader = parser.getText())
      {
          // Обробіть витягнутий текст
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # Створіть екземпляр класу Parser, передаючи потрібний файл
  with Parser("source.pdf") as parser:
      # Витягніть текст
      text = parser.get_text()

      # Обробіть витягнутий текст
      print(text)

Підтримується більш ніж 50 форматів документів і зображень

GroupDocs.Parser SDK парсера документів дозволяє здійснювати операції парсингу Office документів, PDF, зображень, електронних листів, архівів та ін.

GroupDocs.Parser досягнення

Дізнайтеся про ключові метрики досягнень нашої бібліотеки

  • 50+

    Підтримувані формати

    GroupDocs.Parser підтримує операції з більш ніж 50 популярними форматами файлів.

  • 1600k

    Завантаження з NuGet

    GroupDocs.Parser для .NET пакету NuGet було завантажено понад 1 600 000 разів.

  • 18k

    Завантаження з Maven

    GroupDocs.Parser має 18 000 завантажень на Maven. Потужні функції парсингу для Java.

  • 140+

    Щасливі клієнти

    Відомі компанії та окремі розробники надають перевагу продуктам GroupDocs для створення інноваційних рішень.

Наші щасливі клієнти

GroupDocs бібліотеки використовуються провідними та відомими брендами по всьому світу.

Платформна незалежність

GroupDocs.Parser бібліотека підтримує наступні операційні системи та фреймворки:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

Готові розпочати?

Спробуйте функції GroupDocs.Parser безкоштовно на вашій платформі

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Часто задавані питання

Відповіді на найчастіші запитання.

  • Чи потребує бібліотека GroupDocs.Parser якого‑небудь стороннього ПЗ для обробки документів?
    GroupDocs.Parser не вимагає встановлення жодного стороннього ПЗ, такого як Adobe Acrobat, Microsoft Office або будь‑яке інше.
  • Чи можу я спробувати бібліотеку GroupDocs.Parser перед її придбанням?
    Так, ви можете випробувати GroupDocs.Parser без придбання ліцензії. Після встановлення без ліцензії бібліотека працює в режимі пробної версії. У цьому режимі до результуючого документа додаються позначки trial, і він обрізається до перших 3‑х сторінок. Якщо ви бажаєте протестувати GroupDocs.Parser без обмежень пробної версії, ви також можете запросити 30‑денну тимчасову ліцензію. Для отримання додаткової інформації, дивіться.
  • Які ліцензії ви пропонуєте?
    Ми пропонуємо кілька типів ліцензій, що відповідають потребам конкретних розробників або компаній. Типи ліцензій залежать від кількості розробників, кількості розташувань сайтів розробників та того, чи потрібно вам надавати наш SDK/API кінцевим користувачам. Альтернативно, ви можете обрати порахункові (Metered) ліцензії на основі місячного використання продукту. Дізнайтеся більше тут.

GroupDocs.Parser low‑code API парсера документів

Вбудуйте можливості парсингу документів у будь‑який застосунок за допомогою нашого хмарного REST API та SDK.

GroupDocs.Parser Document Parser додатки без коду

Веб‑додатки парсера документів, які дозволяють витягати дані з більш ніж 50 популярних форматів файлів безпосередньо у вашому браузері.

 Українська