Document Parser SDK

Document Parser SDK ที่เป็นมิตรกับนักพัฒนาเพื่อสกัดข้อความ, รูปภาพ, บาร์โค้ด, เมทาดาต้าและตารางจากรูปแบบเอกสารและรูปภาพกว่า 50 รูปแบบ

รวมการแยกเอกสารประสิทธิภาพสูงเข้าไปในแอปพลิเคชัน .NET, Java และ Python ของคุณด้วยความพยายามในการเขียนโค้ดเพียงเล็กน้อย

ใช้เทมเพลตที่ยืดหยุ่นและ API ขั้นสูงเพื่อปรับแต่งกฎการแยกและส่งมอบผลลัพธ์ข้อมูลที่เป็นระเบียบและมีโครงสร้าง

GroupDocs.Parser อย่างคร่าวๆ

Document Parser SDK ที่มีประสิทธิภาพสำหรับสกัดข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างจาก PDF, เอกสาร Office, รูปภาพ, อีเมล และไฟล์เก็บถาวร

  • สกัดข้อความ

    สกัดข้อมูลข้อความจากรูปแบบไฟล์ต่างๆ

  • สกัดรูปภาพ

    ดึงเนื้อหาภาพจากแหล่งที่หลากหลาย

  • แยกข้อมูลด้วยเทมเพลต

    สร้างเทมเพลตที่กำหนดเองและใช้เพื่อแยกข้อมูลเฉพาะ

  • แยกแบบฟอร์ม PDF

    แบบฟอร์ม PDF คือเอกสารดิจิทัลที่มีฟิลด์ให้กรอกสำหรับการโต้ตอบของผู้ใช้

GroupDocs.Parser ตัวอย่างโค้ด

ตัวอย่างการใช้กรณีของการทำงานทั่วไปของ GroupDocs.Parser ใน C#, Java และ Python

วิธีการสกัดข้อความจากเอกสาร PDF

API ของ GroupDocs.Parser ทำให้การสกัดข้อความจากเอกสารเป็นเรื่องง่ายโดยดำเนินการเพียงไม่กี่ขั้นตอน.
  // สร้างอินสแตนซ์ของคลาส Parser พร้อมส่งไฟล์ที่ต้องการ
  using (var parser = new Parser("source.pdf"))
  {
      // สกัดข้อความ
      using (var textReader = parser.GetText())
      {
          // ประมวลผลข้อความที่สกัดได้
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // สร้างอินสแตนซ์ของคลาส Parser พร้อมส่งไฟล์ที่ต้องการ
  try (Parser parser = new Parser("source.pdf"))
  {
      // สกัดข้อความ
      try (TextReader reader = parser.getText())
      {
          // ประมวลผลข้อความที่สกัดได้
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # สร้างอินสแตนซ์ของคลาส Parser พร้อมส่งไฟล์ที่ต้องการ
  with Parser("source.pdf") as parser:
      # สกัดข้อความ
      text = parser.get_text()

      # ประมวลผลข้อความที่สกัดได้
      print(text)

รองรับรูปแบบเอกสารและรูปภาพกว่า 50 รูปแบบ

GroupDocs.Parser Document Parser SDK ช่วยให้การทำงานแยกเอกสารทำได้กับเอกสาร Office, PDF, รูปภาพ, อีเมล, ไฟล์เก็บถาวร และอื่น ๆ

ความสำเร็จของ GroupDocs.Parser

ค้นพบเมตริกสำคัญของความสำเร็จของไลบรารีของเรา

  • 50+

    รูปแบบที่รองรับ

    GroupDocs.Parser รองรับการทำงานกับรูปแบบไฟล์ที่เป็นที่นิยมมากกว่า 50 รูปแบบ.

  • 1600k

    การดาวน์โหลดจาก NuGet

    GroupDocs.Parser สำหรับแพ็กเกจ NuGet ของ .NET ถูกดาวน์โหลดมากกว่า 1,600,000 ครั้ง.

  • 18k

    การดาวน์โหลดจาก Maven

    GroupDocs.Parser มีการดาวน์โหลด 18,000 ครั้งบน Maven. ฟีเจอร์การแยกข้อมูล Java ที่มีประสิทธิภาพ.

  • 140+

    ลูกค้าที่พึงพอใจ

    ทั้งบริษัทชื่อดังและนักพัฒนารายบุคคลต่างก็ชื่นชอบผลิตภัณฑ์ของ GroupDocs เพื่อสร้างโซลูชันที่เป็นนวัตกรรม

ลูกค้าที่พึงพอใจของเรา

ไลบรารีของ GroupDocs ถูกนำไปใช้โดยแบรนด์ระดับโลกที่มีชื่อเสียงและโดดเด่นทั่วโลก

ความเป็นอิสระของแพลตฟอร์ม

GroupDocs.Parser ไลบรารีรองรับระบบปฏิบัติการและเฟรมเวิร์กต่อไปนี้:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

พร้อมเริ่มต้นแล้วหรือยัง?

ลองใช้ฟีเจอร์ของ GroupDocs.Parser ฟรีบนแพลตฟอร์มของคุณ

ทรัพยากรที่มีประโยชน์

สำรวจเอกสารตัวอย่างรหัสและการสนับสนุนชุมชนเพื่อปรับปรุงประสบการณ์ของคุณ

คำถามที่พบบ่อย

คำตอบสำหรับคำถามที่พบบ่อยที่สุด

  • ไลบรารี GroupDocs.Parser ต้องการซอฟต์แวร์ของบุคคลที่สามอื่นใดเพื่อจัดการเอกสารหรือไม่?
    GroupDocs.Parser ไม่ต้องการซอฟต์แวร์ภายนอกใดๆ เช่น Adobe Acrobat, Microsoft Office หรืออื่นๆ ติดตั้ง
  • ฉันสามารถทดลองไลบรารี GroupDocs.Parser ก่อนซื้อได้หรือไม่?
    ได้, คุณสามารถทดลองใช้ GroupDocs.Parser ได้โดยไม่ต้องซื้อใบอนุญาต เมื่อติดตั้งโดยไม่มีใบอนุญาต ไลบรารีจะทำงานในโหมดทดลอง ในโหมดนี้จะมีการเพิ่มป้ายแบ๊จทดลองลงในเอกสารผลลัพธ์และจะตัดให้เหลือเพียง 3 หน้าแรก หากคุณต้องการทดสอบ GroupDocs.Parser โดยไม่มีข้อจำกัดของเวอร์ชันทดลอง คุณสามารถขอใบอนุญาตชั่วคราว 30 วันได้ สำหรับรายละเอียดเพิ่มเติม, ดู.
  • คุณมีใบอนุญาตประเภทใดบ้าง?
    เรามีประเภทใบอนุญาตหลายแบบเพื่อตอบสนองความต้องการของนักพัฒนา หรือบริษัทแต่ละแห่ง ประเภทใบอนุญาตขึ้นกับจำนวนนักพัฒนา จำนวนสถานที่ติดตั้งของนักพัฒนา และว่าคุณต้องการแจกจ่าย SDK/API ของเราให้แก่ลูกค้าสุดท้ายหรือไม่ อีกทางหนึ่ง คุณสามารถเลือกใบอนุญาตแบบ Metered ที่คำนวณตามการใช้งานรายเดือนของผลิตภัณฑ์เพิ่มเติมได้ เรียนรู้เพิ่มเติม ที่นี่.

GroupDocs.Parser API เอกสารแบบ low‑code

รวมความสามารถในการแยกเอกสารเข้าในแอปพลิเคชันใด ๆ ด้วย REST API และ SDK บนคลาวด์ของเรา

GroupDocs.Parser แอปแยกเอกสารแบบ No‑Code

แอปแยกเอกสารบนเว็บที่ช่วยให้คุณดึงข้อมูลจากไฟล์รูปแบบยอดนิยมกว่า 50 แบบโดยตรงในเบราว์เซอร์ของคุณ

 ไทย