GroupDocs.Parser in sintesi

Document Parser SDK per eseguire l’analisi ad alta precisione dei documenti nelle applicazioni .NET

Illustration parser

Estrai dati dai documenti

GroupDocs.Parser for .NET API ti consente di recuperare testo, metadati e immagini da una vasta gamma di formati di file, tra cui documenti Office, email, allegati e archivi. Questo potente strumento ti aiuta ad accedere e processare in modo efficiente le informazioni preziose contenute in questi file per varie applicazioni come l’analisi dei dati, l’indicizzazione per motori di ricerca o i sistemi di gestione dei contenuti.

Analizza i documenti

Estrai diversi elementi come collegamenti ipertestuali, tabelle, codici QR, codici a barre e dati dai moduli PDF. Inoltre, analizza qualsiasi informazione desiderata dai documenti utilizzando modelli personalizzati.

Personalizzazione dei risultati

.NET API ti consente di recuperare dati in vari formati come grezzo, strutturato, HTML o Markdown. Inoltre, l’API offre una funzionalità di ricerca per individuare parole o frasi specifiche nel testo dei documenti.

Indipendenza dalla piattaforma

GroupDocs.Parser for .NET supporta i seguenti sistemi operativi, framework e gestori di pacchetti

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Formati di file supportati

GroupDocs.Parser for .NET supporta operazioni con i seguenti formati di file.

Formati Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Immagini e altri formati

  • Portatile: PDF
  • Immagini: JPG, BMP, PNG, TIFF, GIF
  • Altri formati Office: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Altri formati

  • Web: HTML, MHTML
  • Archivi: ZIP, TAR, 7Z
  • e-Book: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET caratteristiche

Estrai dati da PDF, documenti Office, immagini e altri formati in modo rapido e preciso con il nostro Document Parser SDK per .NET

Feature icon

Estrai testo

Estrai informazioni testuali da vari formati di file, come documenti Office, PDF e immagini, per una facile leggibilità e analisi.

Feature icon

Estrai immagini

Recupera contenuti visivi da diverse fonti, come documenti Office e file PDF, per un accesso e utilizzo pratici.

Feature icon

Scansiona codici QR

Rileva e decodifica i codici QR presenti in documenti Office, file PDF o contenuti visivi per un recupero efficiente delle informazioni.

Feature icon

Estrai dati da allegati email e archivi

Raccogli informazioni preziose da messaggi email, allegati di file e sorgenti di dati compressi per un’analisi e un utilizzo efficaci.

Feature icon

Estrai tabelle

Identifica ed estrai dati tabulari da documenti PDF per un’analisi e utilizzo organizzati.

Feature icon

Estrai collegamenti ipertestuali

Individua ed estrae collegamenti ipertestuali e indirizzi email all’interno di documenti Office o file PDF per un accesso efficiente.

Feature icon

Analizza moduli PDF

I moduli PDF sono documenti digitali con campi compilabili per l’interazione dell’utente, consentendo l’inserimento elettronico delle informazioni. L’API .NET può essere utilizzata per estrarre dati da questi moduli per un’elaborazione efficiente.

Feature icon

Analizza dati tramite template

Crea template personalizzati e utilizzali con l’API .NET per analizzare informazioni specifiche da file PDF, semplificando i processi di estrazione dei dati.

Feature icon

Cerca testo nei documenti

Individua rapidamente parole o pattern specifici all’interno dei documenti.

Esempi di codice

Alcuni casi d’uso tipici delle operazioni di GroupDocs.Parser for .NET

Estrai immagini da documenti PDF

GroupDocs.Parser for .NET semplifica per gli sviluppatori C# l’estrazione di immagini da documenti:

Estrai immagini da documenti PDF in C#

// Crea un'istanza della classe Parser
using (var parser = new Parser("source.pptx"))
{
    // Estrai immagini
    var images = parser.GetImages();

    // Verifica se è stato estratto qualcosa
    if (images == null)
    {
        return;
    }
    // Itera sulle immagini
    foreach (PageImageArea image in images)
    {
        // Stampa l'indice della pagina, il rettangolo e il tipo di immagine
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Estrai codici a barre dalle immagini

Utilizza la nostra API .NET per estrarre codici a barre dalle immagini:

Estrai codici a barre dalle immagini in C#

// Carica l'immagine sorgente in Parser
using (var parser = new Parser("source.jpg"))
{
    // Verifica se il file supporta l'estrazione di codici a barre
    if (parser.Features.Barcodes)
    {
        // Estrai i codici a barre dal file
        var barcodes = parser.GetBarcodes();

        // Itera sui codici a barre
        foreach (var barcode in barcodes)
        {
            // Stampa l'indice della pagina
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Stampa il valore del codice a barre
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

Pronto per iniziare?

Scarica GroupDocs.Parser gratuitamente o ottieni una licenza di prova per l’accesso completo!

Risorse utili

Esplora la documentazione, i campioni di codice e il supporto della comunità per migliorare la tua esperienza.

Suggerimenti per la licenza temporanea

1
Iscriviti con la tua email di lavoro. I servizi di posta gratuiti non sono consentiti.
2
Utilizza il pulsante Ottieni una licenza temporanea nel secondo passaggio.
 Italiano