GroupDocs.Parser อย่างคร่าวๆ

Document Parser SDK สำหรับการแปลงเอกสารด้วยความแม่นยำสูงในแอปพลิเคชัน .NET

Illustration parser

สกัดข้อมูลจากเอกสาร

GroupDocs.Parser for .NET API ช่วยให้คุณดึงข้อความ, metadata และรูปภาพจากรูปแบบไฟล์หลากหลาย เช่น เอกสาร Office, อีเมล, ไฟล์แนบและไฟล์เก็บข้อมูล เครื่องมือนี้ช่วยให้คุณเข้าถึงและประมวลผลข้อมูลสำคัญในไฟล์เหล่านี้ได้อย่างมีประสิทธิภาพสำหรับการใช้งานต่าง ๆ เช่น การวิเคราะห์ข้อมูล, การทำดัชนีเครื่องมือค้นหา หรือระบบจัดการเนื้อหา

แปลงเอกสาร

สกัดส่วนประกอบต่าง ๆ เช่น ลิงก์, ตาราง, QR Code, barcode และข้อมูลจากแบบฟอร์ม PDF. นอกจากนี้ยังสามารถแปลงข้อมูลที่ต้องการจากเอกสารโดยใช้เทมเพลตที่กำหนดเอง

ปรับแต่งผลลัพธ์

.NET API ช่วยให้คุณดึงข้อมูลในรูปแบบต่าง ๆ เช่น raw, structured, HTML หรือ Markdown. นอกจากนี้ API ยังมีฟังก์ชันการค้นหาเพื่อหาคำหรือวลีเฉพาะในข้อความของเอกสาร

ความเป็นอิสระของแพลตฟอร์ม

GroupDocs.Parser for .NET รองรับระบบปฏิบัติการ, เฟรมเวิร์ก และผู้จัดการแพ็คเกจต่อไปนี้

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

รูปแบบไฟล์ที่รองรับ

GroupDocs.Parser for .NET รองรับการทำงานกับ รูปแบบไฟล์ ต่อไปนี้.

รูปแบบ Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

รูปภาพและรูปแบบอื่น ๆ

  • พกพา: PDF
  • รูปภาพ: JPG, BMP, PNG, TIFF, GIF
  • รูปแบบ Office อื่น ๆ: ODT, OTT, OTS, ODS, ODP, OTP, ODG

รูปแบบอื่น ๆ

  • เว็บ: HTML, MHTML
  • ไฟล์เก็บข้อมูล: ZIP, TAR, 7Z
  • อีบุ๊ค: CHM, EPUB, FB2, MOBI

คุณลักษณะของ GroupDocs.Parser for .NET

สกัดข้อมูลจาก PDF, เอกสาร Office, ภาพและรูปแบบอื่น ๆ อย่างรวดเร็วและแม่นยำด้วย .NET Document Parser SDK ของเรา

Feature icon

สกัดข้อความ

สกัดข้อมูลข้อความจากรูปแบบไฟล์ต่าง ๆ เช่น เอกสาร Office, ไฟล์ PDF และภาพ เพื่อความอ่านง่ายและการวิเคราะห์

Feature icon

สกัดรูปภาพ

ดึงเนื้อหาภาพจากแหล่งต่าง ๆ เช่น เอกสาร Office, ไฟล์ PDF เพื่อการเข้าถึงและใช้ประโยชน์ได้สะดวก

Feature icon

สแกน QR Code

ตรวจจับและถอดรหัส QR Code ที่อยู่ในเอกสาร Office, ไฟล์ PDF หรือเนื้อหาภาพ เพื่อการเรียกคืนข้อมูลอย่างมีประสิทธิภาพ

Feature icon

สกัดข้อมูลจากไฟล์แนบอีเมลและไฟล์เก็บข้อมูล

รวบรวมข้อมูลที่มีคุณค่าจากข้อความอีเมล, ไฟล์แนบ และแหล่งข้อมูลที่บีบอัดเพื่อการวิเคราะห์และใช้งานอย่างมีประสิทธิภาพ.

Feature icon

ดึงตาราง

ระบุและดึงข้อมูลแบบตารางจากเอกสาร PDF เพื่อการวิเคราะห์และการใช้งานอย่างเป็นระบบ.

Feature icon

ดึงไฮเปอร์ลิงก์

ค้นหาและดึงไฮเปอร์ลิงก์และที่อยู่อีเมลภายในเอกสาร Office หรือไฟล์ PDF เพื่อการเข้าถึงอย่างมีประสิทธิภาพ.

Feature icon

แยกวิเคราะห์แบบฟอร์ม PDF

แบบฟอร์ม PDF คือเอกสารดิจิทัลที่มีฟิลด์ที่สามารถกรอกได้เพื่อการโต้ตอบของผู้ใช้ ให้ผู้ใช้ป้อนข้อมูลแบบอิเล็กทรอนิกส์ได้ API ของ .NET สามารถใช้เพื่อดึงข้อมูลจากแบบฟอร์มเหล่านี้เพื่อการประมวลผลที่มีประสิทธิภาพ.

Feature icon

แยกวิเคราะห์ข้อมูลโดยใช้เทมเพลต

สร้างเทมเพลตที่กำหนดเองและใช้ร่วมกับ API ของ .NET เพื่อนำมาวิเคราะห์ข้อมูลเฉพาะจากไฟล์ PDF ทำให้กระบวนการดึงข้อมูลง่ายขึ้น.

Feature icon

ค้นหาข้อความในเอกสาร

ค้นหาคำหรือรูปแบบเฉพาะในเอกสารได้อย่างรวดเร็ว.

ตัวอย่างโค้ด

ตัวอย่างการใช้งานทั่วไปของ GroupDocs.Parser for .NET

ดึงภาพจากเอกสาร PDF

GroupDocs.Parser for .NET ทำให้ผู้พัฒนา C# สามารถดึงภาพจาก เอกสาร ได้อย่างง่ายดาย:

สกัดภาพจากเอกสาร PDF ด้วย C#

// สร้างอินสแตนซ์ของคลาส Parser
using (var parser = new Parser("source.pptx"))
{
    // สกัดภาพ
    var images = parser.GetImages();

    // ตรวจสอบว่ามีการสกัดข้อมูลหรือไม่
    if (images == null)
    {
        return;
    }
    // วนลูปผ่านภาพ
    foreach (PageImageArea image in images)
    {
        // พิมพ์ดัชนีหน้าที่, สี่เหลี่ยมและประเภทของภาพ
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

ดึงบาร์โค้ดจากภาพ

ใช้ API .NET ของเราเพื่อดึง บาร์โค้ด จากภาพ:

สกัดบาร์โค้ดจากภาพด้วย C#

// โหลดภาพต้นฉบับเข้าสู่ Parser
using (var parser = new Parser("source.jpg"))
{
    // ตรวจสอบว่าไฟล์รองรับการสกัดบาร์โค้ดหรือไม่
    if (parser.Features.Barcodes)
    {
        // สกัดบาร์โค้ดจากไฟล์
        var barcodes = parser.GetBarcodes();

        // วนลูปผ่านบาร์โค้ด
        foreach (var barcode in barcodes)
        {
            // พิมพ์ดัชนีหน้า
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // พิมพ์ค่าบาร์โค้ด
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

พร้อมที่จะเริ่มต้นหรือยัง?

ดาวน์โหลด GroupDocs.Parser ฟรีหรือรับสิทธิ์การใช้งานแบบทดลองใช้เพื่อการเข้าถึงแบบเต็ม!

ทรัพยากรที่มีประโยชน์

สำรวจเอกสารตัวอย่างรหัสและการสนับสนุนชุมชนเพื่อปรับปรุงประสบการณ์ของคุณ

เคล็ดลับใบอนุญาตชั่วคราว

1
ลงทะเบียนด้วยอีเมลที่ทำงานของคุณ ไม่อนุญาตให้ใช้บริการอีเมลฟรี
2
ใช้ปุ่ม รับใบอนุญาตชั่วคราว ในขั้นตอนที่ 2
 ไทย