GroupDocs.Parser อย่างคร่าวๆ

Document Parser SDK สำหรับการแยกวิเคราะห์เอกสารความแม่นยำสูงในแอปพลิเคชัน Java

Illustration parser

ดึงข้อมูลจากเอกสาร

API ของ GroupDocs.Parser for Java ช่วยให้คุณสามารถดึงข้อความ, metadata, และภาพจากหลากหลายรูปแบบไฟล์ เช่น เอกสาร Office, อีเมล, ไฟล์แนบ และไฟล์อัดบีบนี้ได้ เครื่องมือนี้มีประสิทธิภาพช่วยให้คุณเข้าถึงและประมวลผลข้อมูลที่มีคุณค่าในไฟล์เหล่านี้ได้อย่างมีประสิทธิภาพสำหรับการประยุกต์ใช้งานต่าง ๆ เช่น การวิเคราะห์ข้อมูล, การจัดทำดัชนีเครื่องมือค้นหา, หรือระบบการจัดการเนื้อหา.

ประมวลผลเอกสาร

ดึงเอาตัวองค์ประกอบต่าง ๆ เช่น ไฮเปอร์ลิงก์, ตาราง, QR โค้ด, บาร์โค้ด และข้อมูลจากแบบฟอร์ม PDF อีกทั้งยังสามารถประมวลผลข้อมูลใด ๆ ที่ต้องการจากเอกสารโดยใช้เทมเพลตแบบกำหนดเองได้

ปรับแต่งผลลัพธ์

Java API ทำให้คุณสามารถดึงข้อมูลในรูปแบบต่าง ๆ เช่น ดิบ, โครงสร้าง, HTML หรือ Markdown นอกจากนี้ API ยังมีฟังก์ชันการค้นหาเพื่อค้นหาคำหรือวลีเฉพาะภายในข้อความของเอกสาร

ความเป็นอิสระของแพลตฟอร์ม

GroupDocs.Parser for Java รองรับระบบปฏิบัติการ, เฟรมเวิร์กและตัวจัดการแพ็คเกจต่อไปนี้

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
Maven

รูปแบบไฟล์ที่รองรับ

GroupDocs.Parser for Java รองรับการทำงานกับ รูปแบบไฟล์ ต่อไปนี้.

รูปแบบ Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

รูปภาพและรูปแบบอื่น ๆ

  • พกพา: PDF
  • รูปภาพ: JPG, BMP, PNG, TIFF, GIF
  • รูปแบบ Office อื่น ๆ: ODT, OTT, OTS, ODS, ODP, OTP, ODG

รูปแบบอื่น ๆ

  • เว็บ: HTML, MHTML
  • ไฟล์เก็บข้อมูล: ZIP, TAR, 7Z
  • อีบุ๊ค: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for Java คุณลักษณะ

ดึงข้อมูลจาก PDF, เอกสาร Office, ภาพและรูปแบบอื่น ๆ อย่างรวดเร็วและแม่นยำด้วย Java Document Parser SDK ของเรา

Feature icon

สกัดข้อความ

สกัดข้อมูลข้อความจากรูปแบบไฟล์ต่าง ๆ เช่น เอกสาร Office, ไฟล์ PDF และภาพ เพื่อความอ่านง่ายและการวิเคราะห์

Feature icon

สกัดรูปภาพ

ดึงเนื้อหาภาพจากแหล่งต่าง ๆ เช่น เอกสาร Office, ไฟล์ PDF เพื่อการเข้าถึงและใช้ประโยชน์ได้สะดวก

Feature icon

สแกน QR Code

ตรวจจับและถอดรหัส QR Code ที่อยู่ในเอกสาร Office, ไฟล์ PDF หรือเนื้อหาภาพ เพื่อการเรียกคืนข้อมูลอย่างมีประสิทธิภาพ

Feature icon

สกัดข้อมูลจากไฟล์แนบอีเมลและไฟล์เก็บข้อมูล

รวบรวมข้อมูลที่มีคุณค่าจากข้อความอีเมล, ไฟล์แนบ และแหล่งข้อมูลที่บีบอัดเพื่อการวิเคราะห์และใช้งานอย่างมีประสิทธิภาพ.

Feature icon

ดึงตาราง

ระบุและดึงข้อมูลแบบตารางจากเอกสาร PDF เพื่อการวิเคราะห์และการใช้งานอย่างเป็นระบบ.

Feature icon

ดึงไฮเปอร์ลิงก์

ค้นหาและดึงไฮเปอร์ลิงก์และที่อยู่อีเมลภายในเอกสาร Office หรือไฟล์ PDF เพื่อการเข้าถึงอย่างมีประสิทธิภาพ.

Feature icon

แยกวิเคราะห์แบบฟอร์ม PDF

แบบฟอร์ม PDF คือเอกสารดิจิทัลที่มีฟิลด์ที่สามารถกรอกได้เพื่อการโต้ตอบของผู้ใช้ ให้ผู้ใช้ป้อนข้อมูลแบบอิเล็กทรอนิกส์ได้ API ของ .NET สามารถใช้เพื่อดึงข้อมูลจากแบบฟอร์มเหล่านี้เพื่อการประมวลผลที่มีประสิทธิภาพ.

Feature icon

แยกวิเคราะห์ข้อมูลโดยใช้เทมเพลต

สร้างเทมเพลตที่กำหนดเองและใช้ร่วมกับ API ของ .NET เพื่อนำมาวิเคราะห์ข้อมูลเฉพาะจากไฟล์ PDF ทำให้กระบวนการดึงข้อมูลง่ายขึ้น.

Feature icon

ค้นหาข้อความในเอกสาร

ค้นหาคำหรือรูปแบบเฉพาะในเอกสารได้อย่างรวดเร็ว.

ตัวอย่างโค้ด

ตัวอย่างการใช้ทั่วไปของการดำเนินการ GroupDocs.Parser for Java

ดึงภาพจากเอกสาร PDF

GroupDocs.Parser for Java ทำให้นักพัฒนา Java สามารถดึงภาพจาก เอกสาร ได้ง่าย:

สกัดภาพจากเอกสาร PDF ด้วย Java

// สร้างอินสแตนซ์ของคลาส Parser
try (Parser parser = new Parser("source.pdf"))
{
    // สกัดภาพ
    Iterable<PageImageArea> images = parser.getImages();

    // ตรวจสอบว่ามีการสกัดข้อมูลหรือไม่
    if (images == null) {
        return;
    }

    // วนลูปผ่านภาพ
    for (PageImageArea image : images) {
        // พิมพ์ดัชนีหน้าที่, สี่เหลี่ยมและประเภทของภาพ
        System.out.println(String.format("Page: %d, R: %s, Type: %s", 
            image.getPage().getIndex(), image.getRectangle(), image.getFileType()));
    }
}

ดึงบาร์โค้ดจากภาพ

ใช้ API Java ของเราเพื่อสกัด บาร์โค้ด จากรูปภาพ:

สกัดบาร์โค้ดจากภาพด้วย Java

// โหลดภาพต้นฉบับเข้าสู่ Parser
try (Parser parser = new Parser("source.jpg")){

    // ตรวจสอบว่าไฟล์รองรับการสกัดบาร์โค้ดหรือไม่
    if (!parser.getFeatures().isBarcodes()) {

        // สกัดบาร์โค้ดจากไฟล์
        Iterable<PageBarcodeArea> barcodes = parser.getBarcodes();

        // วนลูปผ่านบาร์โค้ด
        for (PageBarcodeArea barcode : barcodes) {
            // พิมพ์ดัชนีหน้า
            System.out.println("Page: " + barcode.getPage().getIndex());
            // พิมพ์ค่าบาร์โค้ด
            System.out.println("Value: " + barcode.getValue());
        }
    }
}

พร้อมที่จะเริ่มต้นหรือยัง?

ดาวน์โหลด GroupDocs.Parser ฟรีหรือรับสิทธิ์การใช้งานแบบทดลองใช้เพื่อการเข้าถึงแบบเต็ม!

ทรัพยากรที่มีประโยชน์

สำรวจเอกสารตัวอย่างรหัสและการสนับสนุนชุมชนเพื่อปรับปรุงประสบการณ์ของคุณ

เคล็ดลับใบอนุญาตชั่วคราว

1
ลงทะเบียนด้วยอีเมลที่ทำงานของคุณ ไม่อนุญาตให้ใช้บริการอีเมลฟรี
2
ใช้ปุ่ม รับใบอนุญาตชั่วคราว ในขั้นตอนที่ 2
 ไทย