GroupDocs.Parser en un coup d’œil

SDK d’analyse de documents pour réaliser une analyse de documents haute précision dans les applications .NET

Illustration parser

Extraire des données à partir de documents

GroupDocs.Parser for .NET API vous permet de récupérer le texte, les métadonnées et les images d’un large éventail de formats de fichiers tels que les documents Office, les e‑mails, les pièces jointes et les archives. Cet outil puissant vous aide à accéder et à traiter efficacement les informations précieuses contenues dans ces fichiers pour diverses applications comme l’analyse de données, l’indexation de moteurs de recherche ou les systèmes de gestion de contenu.

Analyser des documents

Extrayez divers éléments tels que les hyperliens, les tableaux, les QR codes, les codes-barres et les données des formulaires PDF. Analysez également toute information souhaitée à partir de documents à l’aide de modèles personnalisés.

Personnaliser les résultats

L’API .NET vous permet de récupérer des données dans divers formats tels que brut, structuré, HTML ou Markdown. De plus, l’API offre une fonctionnalité de recherche pour localiser des mots ou des phrases spécifiques dans le texte des documents.

Indépendance de plateforme

GroupDocs.Parser for .NET prend en charge les systèmes d’exploitation, les frameworks et les gestionnaires de packages suivants

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Formats de fichiers pris en charge

GroupDocs.Parser for .NET prend en charge les opérations avec les formats de fichiers suivants.

Formats Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Images et autres formats

  • Portable: PDF
  • Images: JPG, BMP, PNG, TIFF, GIF
  • Autres formats Office: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Autres formats

  • Web: HTML, MHTML
  • Archives: ZIP, TAR, 7Z
  • e-books: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET fonctionnalités

Extrayez des données des PDF, des documents Office, des images et d’autres formats rapidement et avec précision grâce à notre SDK d’analyse de documents .NET

Feature icon

Extraire du texte

Extrayez les informations textuelles de divers formats de fichiers tels que les documents Office, les fichiers PDF et les images pour une lecture et une analyse aisées.

Feature icon

Extraire des images

Récupérez le contenu visuel de diverses sources comme les documents Office ou les fichiers PDF pour un accès et une utilisation pratiques.

Feature icon

Scanner les QR Codes

Détectez et décodez les QR codes présents dans les documents Office, les fichiers PDF ou le contenu visuel pour une récupération d’informations efficace.

Feature icon

Extraire des données des pièces jointes d’e‑mail et des archives

Recueillez des informations précieuses à partir des messages électroniques, des pièces jointes et des sources de données compressées pour une analyse et une utilisation efficaces.

Feature icon

Extraire les tableaux

Identifiez et extrayez les données tabulaires des documents PDF pour une analyse et une utilisation organisées.

Feature icon

Extraire les hyperliens

Localisez et extrayez les hyperliens et les adresses e‑mail dans les documents Office ou les fichiers PDF pour un accès efficace.

Feature icon

Analyser les formulaires PDF

Les formulaires PDF sont des documents numériques contenant des champs remplissables pour l’interaction utilisateur, permettant de saisir des informations électroniquement. L’API .NET peut être utilisée pour extraire les données de ces formulaires afin de les traiter efficacement.

Feature icon

Analyser les données à l’aide de modèles

Créez des modèles personnalisés et utilisez‑les avec l’API .NET pour analyser des informations spécifiques à partir de fichiers PDF, simplifiant ainsi les processus d’extraction de données.

Feature icon

Rechercher du texte dans les documents

Localisez rapidement des mots ou des motifs spécifiques dans les documents.

Exemples de code

Quelques cas d’utilisation typiques des opérations GroupDocs.Parser for .NET

Extraire des images de documents PDF

GroupDocs.Parser for .NET facilite l’extraction d’images par les développeurs C# à partir des documents :

Extraire des images de documents PDF en C#

// Créez une instance de la classe Parser
using (var parser = new Parser("source.pptx"))
{
    // Extrayez les images
    var images = parser.GetImages();

    // Vérifiez si quelque chose a été extrait
    if (images == null)
    {
        return;
    }
    // Itérez sur les images
    foreach (PageImageArea image in images)
    {
        // Affichez l'index de page, le rectangle et le type d'image
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Extraire les codes-barres à partir d’images

Utilisez notre API .NET pour extraire les codes‑barres à partir d’images :

Extraire les codes-barres d'images en C#

// Chargez l'image source dans Parser
using (var parser = new Parser("source.jpg"))
{
    // Vérifiez si le fichier prend en charge l'extraction de codes-barres
    if (parser.Features.Barcodes)
    {
        // Extrayez les codes-barres du fichier
        var barcodes = parser.GetBarcodes();

        // Itérez sur les codes-barres
        foreach (var barcode in barcodes)
        {
            // Affichez l'index de page
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Affichez la valeur du code-barres
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

Prêt à commencer ?

Téléchargez GroupDocs.Parser gratuitement ou obtenez une licence d’essai pour un accès complet !

Ressources utiles

Explorez la documentation, les échantillons de code et le soutien communautaire pour améliorer votre expérience.

Conseils sur les licences temporaires

1
Inscrivez-vous avec votre adresse e-mail professionnelle. Les services de messagerie gratuits ne sont pas autorisés.
2
Utilisez le bouton Obtenir une licence temporaire à la deuxième étape.
 Français