Зручний для розробників SDK парсера документів для витягування тексту, зображень, штрих-кодів, метаданих та таблиць з понад 50 форматів документів і зображень.
Інтегруйте високопродуктивний парсинг документів у ваші .NET, Java та Python додатки з мінімальними зусиллями кодування.
Використовуйте гнучкі шаблони та розширені API для налаштування правил парсингу та отримання чистих, структурованих даних.
Потужний SDK парсера документів для витягування структурованих та неструктурованих даних з PDF, Office документів, зображень, електронних листів та архівів.
Витягування текстової інформації з різних форматів файлів
Отримання візуального вмісту з різних джерел
Створюйте власні шаблони та використовуйте їх для парсингу конкретної інформації
PDF‑форми — це цифрові документи з полями, які можна заповнювати, для взаємодії користувача
Деякі випадки використання типових операцій GroupDocs.Parser на C#, Java та Python
// Створіть екземпляр класу Parser, передаючи потрібний файл
using (var parser = new Parser("source.pdf"))
{
// Витягніть текст
using (var textReader = parser.GetText())
{
// Обробіть витягнутий текст
Console.WriteLine(textReader?.ReadToEnd());
}
}
// Створіть екземпляр класу Parser, передаючи потрібний файл
try (Parser parser = new Parser("source.pdf"))
{
// Витягніть текст
try (TextReader reader = parser.getText())
{
// Обробіть витягнутий текст
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
from groupdocs.parser import Parser
# Створіть екземпляр класу Parser, передаючи потрібний файл
with Parser("source.pdf") as parser:
# Витягніть текст
text = parser.get_text()
# Обробіть витягнутий текст
print(text)
GroupDocs.Parser SDK парсера документів дозволяє здійснювати операції парсингу Office документів, PDF, зображень, електронних листів, архівів та ін.
Дізнайтеся про ключові метрики досягнень нашої бібліотеки
GroupDocs.Parser підтримує операції з більш ніж 50 популярними форматами файлів.
GroupDocs.Parser для .NET пакету NuGet було завантажено понад 1 600 000 разів.
GroupDocs.Parser має 18 000 завантажень на Maven. Потужні функції парсингу для Java.
Відомі компанії та окремі розробники надають перевагу продуктам GroupDocs для створення інноваційних рішень.
GroupDocs бібліотеки використовуються провідними та відомими брендами по всьому світу.
GroupDocs.Parser бібліотека підтримує наступні операційні системи та фреймворки:
Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.
Відповіді на найчастіші запитання.
Вбудуйте можливості парсингу документів у будь‑який застосунок за допомогою нашого хмарного REST API та SDK.
cURL‑команди для RESTful хмарного API парсера документів, що дозволяють аналізувати документи у широкому спектрі підтримуваних популярних форматів файлів.
Витягайте зображення, текст, інформацію про документ або навіть парсьте будь‑який документ за допомогою шаблону, визначеного користувачем, у ваших Microsoft .NET застосунках.
Хмарний SDK для розробників Java, щоб парсити документи, витягати інформацію про документ та дані у Java‑застосунках.
Веб‑додатки парсера документів, які дозволяють витягати дані з більш ніж 50 популярних форматів файлів безпосередньо у вашому браузері.
Безкоштовний онлайн‑додаток для парсингу Word, Excel, PowerPoint, PDF та понад 50 інших типів документів.
Парсьте Word‑документи безпосередньо у вашому веб‑браузері, щоб витягати зображення, текст або метадані.
Безкоштовний додаток для парсингу PDF, який працює на будь‑якій платформі чи пристрої без будь‑яких обмежень.