SDK d’analyseur de documents convivial pour les développeurs, permettant d’extraire du texte, des images, des codes‑barres, des métadonnées et des tableaux à partir de plus de 50 formats de documents et d’images.
Intégrez une analyse de documents haute performance dans vos applications .NET, Java et Python avec un effort de codage minimal.
Utilisez des modèles flexibles et des API avancées pour personnaliser les règles d’analyse et fournir des sorties de données propres et structurées.
SDK d’analyseur de documents puissant pour extraire des données structurées et non structurées à partir de PDF, de documents Office, d’images, d’e‑mails et d’archives.
Extraire les informations textuelles de divers formats de fichiers
Récupérer le contenu visuel à partir de sources diverses
Créer des modèles personnalisés et les utiliser pour analyser des informations spécifiques
Les formulaires PDF sont des documents numériques contenant des champs remplissables pour l’interaction utilisateur
Quelques cas d’utilisation typiques des opérations GroupDocs.Parser en C#, Java et Python
// Créez une instance de la classe Parser en transmettant le fichier souhaité
using (var parser = new Parser("source.pdf"))
{
// Extrayez le texte
using (var textReader = parser.GetText())
{
// Traitez le texte extrait
Console.WriteLine(textReader?.ReadToEnd());
}
}
// Créez une instance de la classe Parser en transmettant le fichier souhaité
try (Parser parser = new Parser("source.pdf"))
{
// Extrayez le texte
try (TextReader reader = parser.getText())
{
// Traitez le texte extrait
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
from groupdocs.parser import Parser
# Créez une instance de la classe Parser en transmettant le fichier souhaité
with Parser("source.pdf") as parser:
# Extrayez le texte
text = parser.get_text()
# Traitez le texte extrait
print(text)
Le SDK d’analyseur de documents GroupDocs.Parser permet des opérations d’analyse sur les documents Office, les PDF, les images, les e‑mails, les archives et bien plus.
Découvrez les indicateurs clés des réalisations de notre bibliothèque
GroupDocs.Parser prend en charge les opérations avec plus de 50 formats de fichiers populaires.
Le package NuGet GroupDocs.Parser pour .NET a été téléchargé plus de 1 600 000 fois.
GroupDocs.Parser compte 18 000 téléchargements sur Maven. Fonctionnalités puissantes d’analyse Java.
Des entreprises renommées ainsi que des développeurs individuels préfèrent les produits GroupDocs pour créer des solutions innovantes.
Les bibliothèques GroupDocs sont utilisées par des marques mondialement reconnues et distinguées à travers le monde.
La bibliothèque GroupDocs.Parser prend en charge les systèmes d’exploitation et les cadres suivants :
Explorez la documentation, les échantillons de code et le soutien communautaire pour améliorer votre expérience.
Réponses aux questions les plus fréquemment posées.
Intégrez les capacités de parsing de documents dans n’importe quelle application en utilisant notre API REST et nos SDK cloud.
Commandes cURL pour l’API Cloud de parsing de documents RESTful afin d’analyser des documents parmi une large gamme de formats de fichiers populaires supportés.
Extrayez des images, du texte, des informations de document ou même analysez tout document à l’aide d’un modèle défini par l’utilisateur dans vos applications Microsoft .NET.
SDK cloud pour les développeurs Java afin d’analyser des documents, d’extraire les informations et les données du document dans les applications basées sur Java.
Applications web de parsing de documents qui vous permettent d’extraire des données de plus de 50 formats de fichiers populaires directement dans votre navigateur.
Application en ligne gratuite pour analyser Word, Excel, PowerPoint, PDF et plus de 50 autres types de documents.
Analysez les documents Word directement depuis votre navigateur web pour extraire des images, du texte ou des métadonnées.
Application gratuite de parsing PDF fonctionnant sur n’importe quelle plateforme ou dispositif, sans aucune limitation.