GroupDocs.Parser sekilas

SDK Parser Dokumen untuk melakukan parsing dokumen dengan akurasi tinggi pada aplikasi .NET

Illustration parser

Ekstrak data dari dokumen

GroupDocs.Parser for .NET API memungkinkan Anda mengambil teks, metadata, dan gambar dari berbagai format file seperti dokumen Office, email, lampiran, dan arsip. Alat kuat ini membantu Anda mengakses dan memproses informasi berharga yang terdapat dalam file tersebut secara efisien untuk berbagai aplikasi seperti analisis data, pengindeksan mesin pencari, atau sistem manajemen konten.

Parse dokumen

Ekstrak berbagai elemen seperti hyperlink, tabel, kode QR, kode batang, dan data dari formulir PDF. Juga parse informasi apa pun yang diinginkan dari dokumen menggunakan templat khusus.

Menyesuaikan hasil

.NET API memungkinkan Anda mengambil data dalam berbagai format seperti mentah, terstruktur, HTML, atau Markdown. Selain itu, API menyediakan fungsi pencarian untuk menemukan kata atau frasa tertentu dalam teks dokumen.

Kemandirian Platform

GroupDocs.Parser for .NET mendukung sistem operasi, kerangka kerja, dan manajer paket berikut

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Format file yang didukung

GroupDocs.Parser for .NET mendukung operasi dengan format file berikut.

Format Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Gambar & Format Lain

  • Portable: PDF
  • Gambar: JPG, BMP, PNG, TIFF, GIF
  • Format Office lainnya: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Format lain

  • Web: HTML, MHTML
  • Arsip: ZIP, TAR, 7Z
  • e-Book: CHM, EPUB, FB2, MOBI

Fitur GroupDocs.Parser for .NET

Ekstrak data dari PDF, dokumen Office, gambar, dan format lainnya dengan cepat dan akurat menggunakan SDK Parser Dokumen .NET kami

Feature icon

Ekstrak teks

Ekstrak informasi teks dari berbagai format file seperti dokumen Office, file PDF, dan gambar untuk memudahkan pembacaan dan analisis.

Feature icon

Ekstrak gambar

Ambil konten visual dari berbagai sumber seperti dokumen Office, file PDF untuk akses dan penggunaan yang mudah.

Feature icon

Pindai Kode QR

Deteksi dan dekode kode QR yang terdapat dalam dokumen Office, file PDF, atau konten visual untuk pengambilan informasi yang efisien.

Feature icon

Ekstrak data dari lampiran email dan arsip

Kumpulkan informasi berharga dari pesan email, lampiran file, dan sumber data terkompresi untuk analisis dan pemanfaatan yang efektif.

Feature icon

Ekstrak tabel

Identifikasi dan ekstrak data tabular dari dokumen PDF untuk analisis dan penggunaan yang terstruktur.

Feature icon

Ekstrak hyperlink

Temukan dan ekstrak hyperlink serta alamat email dalam dokumen Office atau file PDF untuk akses yang efisien.

Feature icon

Mengurai Formulir PDF

Formulir PDF adalah dokumen digital dengan bidang yang dapat diisi untuk interaksi pengguna, memungkinkan mereka memasukkan informasi secara elektronik. API .NET dapat digunakan untuk mengekstrak data dari formulir ini untuk pemrosesan yang efisien.

Feature icon

Mengurai data dengan templat

Buat templat khusus dan gunakan bersama API .NET untuk mengurai informasi spesifik dari file PDF, menyederhanakan proses ekstraksi data.

Feature icon

Cari teks dalam dokumen

Temukan dengan cepat kata atau pola tertentu dalam dokumen.

Contoh kode

Beberapa contoh penggunaan operasi GroupDocs.Parser for .NET yang umum

Ekstrak gambar dari dokumen PDF

GroupDocs.Parser for .NET memudahkan pengembang C# untuk mengekstrak gambar dari dokumen:

Ekstrak gambar dari dokumen PDF dalam C#

// Buat instance kelas Parser
using (var parser = new Parser("source.pptx"))
{
    // Ekstrak gambar
    var images = parser.GetImages();

    // Periksa apakah sesuatu telah diekstrak
    if (images == null)
    {
        return;
    }
    // Iterasi gambar
    foreach (PageImageArea image in images)
    {
        // Cetak indeks halaman, persegi panjang, dan tipe gambar
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Ekstrak kode batang dari gambar

Gunakan API .NET kami untuk mengekstrak kode batang dari gambar:

Ekstrak kode batang dari gambar dalam C#

// Muat gambar sumber ke Parser
using (var parser = new Parser("source.jpg"))
{
    // Periksa apakah file mendukung ekstraksi kode batang
    if (parser.Features.Barcodes)
    {
        // Ekstrak kode batang dari file
        var barcodes = parser.GetBarcodes();

        // Iterasi kode batang
        foreach (var barcode in barcodes)
        {
            // Cetak indeks halaman
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Cetak nilai kode batang
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

Siap untuk memulai?

Unduh GroupDocs.Parser secara gratis atau dapatkan lisensi uji coba untuk akses penuh!

Sumber daya yang berguna

Jelajahi dokumentasi, sampel kode, dan dukungan masyarakat untuk meningkatkan pengalaman Anda.

Tip lisensi sementara

1
Daftar dengan email kantor Anda. Layanan email gratis tidak diperbolehkan.
2
Gunakan tombol Dapatkan lisensi sementara pada langkah kedua.
 Indonesian