GroupDocs.Parser auf einen Blick

Document Parser SDK für hochpräzises Dokumentenparsing in .NET‑Anwendungen

Illustration parser

Daten aus Dokumenten extrahieren

GroupDocs.Parser for .NET API ermöglicht das Abrufen von Text, Metadaten und Bildern aus einer Vielzahl von Dateiformaten wie Office-Dokumenten, E‑Mails, Anhängen und Archiven. Dieses leistungsstarke Werkzeug hilft Ihnen, effizient auf wertvolle Informationen in diesen Dateien zuzugreifen und sie zu verarbeiten, z. B. für Datenanalyse, Suchmaschinen‑Indexierung oder Content‑Management‑Systeme.

Dokumente parsen

Extrahieren Sie verschiedene Elemente wie Hyperlinks, Tabellen, QR‑Codes, Barcodes und Daten aus PDF‑Formularen. Außerdem können Sie beliebige Informationen aus Dokumenten mithilfe benutzerdefinierter Vorlagen parsen.

Ergebnisse anpassen

.NET API ermöglicht das Abrufen von Daten in verschiedenen Formaten wie Rohdaten, strukturiert, HTML oder Markdown. Zusätzlich bietet die API eine Suchfunktion, um bestimmte Wörter oder Phrasen im Text von Dokumenten zu finden.

Plattformunabhängigkeit

GroupDocs.Parser for .NET unterstützt die folgenden Betriebssysteme, Frameworks und Paketmanager

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Unterstützte Dateiformate

GroupDocs.Parser for .NET unterstützt Vorgänge mit den folgenden Dateiformaten.

Microsoft‑Office‑Formate

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Bilder & andere Formate

  • Tragbar: PDF
  • Bilder: JPG, BMP, PNG, TIFF, GIF
  • Andere Office-Formate: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Weitere Formate

  • Web: HTML, MHTML
  • Archive: ZIP, TAR, 7Z
  • eBooks: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET Funktionen

Extrahieren Sie Daten aus PDFs, Office‑Dokumenten, Bildern und anderen Formaten schnell und präzise mit unserem .NET Document Parser SDK

Feature icon

Text extrahieren

Extrahieren Sie Textinformationen aus verschiedenen Dateiformaten wie Office‑Dokumenten, PDF‑Dateien und Bildern für einfache Lesbarkeit und Analyse.

Feature icon

Bilder extrahieren

Rufen Sie visuelle Inhalte aus verschiedenen Quellen wie Office‑Dokumenten und PDF‑Dateien ab für bequemen Zugriff und Nutzung.

Feature icon

QR‑Codes scannen

Erkennen und dekodieren Sie QR‑Codes, die in Office‑Dokumenten, PDF‑Dateien oder visuellen Inhalten enthalten sind, für effiziente Informationsbeschaffung.

Feature icon

Daten aus E‑Mail‑Anhängen und Archiven extrahieren

Sammeln Sie wertvolle Informationen aus E-Mails, Dateianhängen und komprimierten Datenquellen für eine effektive Analyse und Nutzung.

Feature icon

Tabellen extrahieren

Identifizieren und extrahieren Sie tabellarische Daten aus PDF-Dokumenten für eine strukturierte Analyse und Verwendung.

Feature icon

Hyperlinks extrahieren

Ermitteln und extrahieren Sie Hyperlinks und E-Mail-Adressen in Office-Dokumenten oder PDF-Dateien für einen effizienten Zugriff.

Feature icon

PDF-Formulare parsen

PDF-Formulare sind digitale Dokumente mit ausfüllbaren Feldern für die Benutzerinteraktion, die die elektronische Eingabe von Informationen ermöglichen. Die .NET API kann verwendet werden, um Daten aus diesen Formularen für eine effiziente Verarbeitung zu extrahieren.

Feature icon

Daten mithilfe von Vorlagen parsen

Erstellen Sie benutzerdefinierte Vorlagen und verwenden Sie diese mit der .NET API, um spezifische Informationen aus PDF-Dateien zu parsen und so den Datenextraktionsprozess zu vereinfachen.

Feature icon

Text in Dokumenten suchen

Suchen Sie schnell bestimmte Wörter oder Muster in Dokumenten.

Codebeispiele

Einige Anwendungsfälle typischer GroupDocs.Parser for .NET-Operationen

Bilder aus PDF-Dokumenten extrahieren

GroupDocs.Parser for .NET erleichtert C# Entwicklern das Extrahieren von Bildern aus Dokumenten:

Bilder aus PDF-Dokumenten in C# extrahieren

// Erstellen Sie eine Instanz der Klasse Parser
using (var parser = new Parser("source.pptx"))
{
    // Bilder extrahieren
    var images = parser.GetImages();

    // Prüfen, ob etwas extrahiert wurde
    if (images == null)
    {
        return;
    }
    // Durchlaufen Sie die Bilder
    foreach (PageImageArea image in images)
    {
        // Seitenindex, Rechteck und Bildtyp ausgeben
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Barcodes aus Bildern extrahieren

Verwenden Sie unsere .NET‑API, um Barcodes aus Bildern zu extrahieren:

Barcodes aus Bildern in C# extrahieren

// Quellbild in Parser laden
using (var parser = new Parser("source.jpg"))
{
    // Prüfen, ob die Datei die Barcode-Extraktion unterstützt
    if (parser.Features.Barcodes)
    {
        // Barcodes aus der Datei extrahieren
        var barcodes = parser.GetBarcodes();

        // Barcodes durchlaufen
        foreach (var barcode in barcodes)
        {
            // Seitenindex ausgeben
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Barcode-Wert ausgeben
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

Bereit, loszulegen?

Laden Sie GroupDocs.Parser kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

Nützliche Ressourcen

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.

Tipps zur temporären Lizenz

1
Melden Sie sich mit Ihrer geschäftlichen E-Mail-Adresse an. Kostenlose E-Mail-Dienste sind nicht zulässig.
2
Klicken Sie im zweiten Schritt auf die Schaltfläche Provisorische Lizenz anfordern.
 Deutsch