SDK Trình Phân Tích Tài Liệu

SDK Trình Phân Tích Tài Liệu thân thiện với nhà phát triển, cho phép trích xuất văn bản, hình ảnh, mã vạch, metadata và bảng từ hơn 50 định dạng tài liệu và hình ảnh.

Tích hợp việc phân tích tài liệu hiệu năng cao vào các ứng dụng .NET, Java và Python của bạn với nỗ lực mã hóa tối thiểu.

Sử dụng các mẫu linh hoạt và API nâng cao để tùy chỉnh quy tắc phân tích và cung cấp đầu ra dữ liệu sạch, có cấu trúc.

GroupDocs.Parser trong một cái nhìn tổng quan

SDK Trình Phân Tích Tài Liệu mạnh mẽ để trích xuất dữ liệu có cấu trúc và không có cấu trúc từ PDF, tài liệu Office, hình ảnh, email và lưu trữ.

  • Trích xuất văn bản

    Trích xuất thông tin văn bản từ nhiều định dạng tệp

  • Trích xuất hình ảnh

    Lấy nội dung hình ảnh từ các nguồn đa dạng

  • Phân tích dữ liệu bằng mẫu

    Tạo mẫu tùy chỉnh và sử dụng chúng để phân tích thông tin cụ thể

  • Phân tích biểu mẫu PDF

    Biểu mẫu PDF là tài liệu kỹ thuật số có các trường có thể điền để người dùng tương tác

GroupDocs.Parser mẫu code

Một số trường hợp sử dụng điển hình của các thao tác GroupDocs.Parser trong C#, Java và Python

Cách trích xuất văn bản từ tài liệu PDF

API GroupDocs.Parser giúp bạn dễ dàng trích xuất văn bản từ tài liệu bằng một vài bước.
  // Tạo một thể hiện của lớp Parser và truyền tệp mong muốn
  using (var parser = new Parser("source.pdf"))
  {
      // Trích xuất văn bản
      using (var textReader = parser.GetText())
      {
          // Xử lý văn bản đã trích xuất
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // Tạo một thể hiện của lớp Parser và truyền tệp mong muốn
  try (Parser parser = new Parser("source.pdf"))
  {
      // Trích xuất văn bản
      try (TextReader reader = parser.getText())
      {
          // Xử lý văn bản đã trích xuất
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # Tạo một thể hiện của lớp Parser và truyền tệp mong muốn
  with Parser("source.pdf") as parser:
      # Trích xuất văn bản
      text = parser.get_text()

      # Xử lý văn bản đã trích xuất
      print(text)

Hơn 50 định dạng tài liệu và hình ảnh được hỗ trợ

SDK Trình Phân Tích Tài Liệu GroupDocs.Parser cho phép thực hiện các thao tác phân tích trên tài liệu Office, PDF, hình ảnh, email, lưu trữ và hơn thế nữa.

GroupDocs.Parser thành tựu

Khám phá các chỉ số chính về thành tựu của thư viện của chúng tôi

  • 50+

    Định dạng được hỗ trợ

    GroupDocs.Parser hỗ trợ các thao tác với hơn 50 định dạng tệp phổ biến.

  • 1600k

    Lượt tải xuống NuGet

    Gói NuGet GroupDocs.Parser cho .NET đã được tải xuống hơn 1.600.000 lần.

  • 18k

    Lượt tải xuống Maven

    GroupDocs.Parser đã có 18.000 lượt tải xuống trên Maven. Tính năng phân tích Java mạnh mẽ.

  • 140+

    Khách hàng hài lòng

    Các công ty nổi tiếng cũng như các nhà phát triển cá nhân đều ưu tiên các sản phẩm của GroupDocs để xây dựng các giải pháp sáng tạo.

Khách hàng hài lòng của chúng tôi

GroupDocs được các thương hiệu danh tiếng và nổi tiếng trên toàn cầu sử dụng.

Độc lập nền tảng

Thư viện GroupDocs.Parser hỗ trợ các hệ điều hành và framework sau:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

Sẵn sàng bắt đầu?

Dùng thử các tính năng của GroupDocs.Parser miễn phí trên nền tảng của bạn

Tài nguyên hữu ích

Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.

Câu hỏi thường gặp

Câu trả lời cho các câu hỏi thường gặp nhất.

  • Thư viện GroupDocs.Parser có cần bất kỳ phần mềm bên thứ ba nào khác để xử lý tài liệu không?
    GroupDocs.Parser không yêu cầu cài đặt bất kỳ phần mềm bên ngoài nào như Adobe Acrobat, Microsoft Office hoặc bất kỳ phần mềm nào khác.
  • Tôi có thể dùng thử thư viện GroupDocs.Parser trước khi mua không?
    Có, bạn có thể dùng thử GroupDocs.Parser mà không cần mua giấy phép. Khi được cài đặt không có giấy phép, thư viện sẽ hoạt động ở chế độ dùng thử. Trong chế độ này, các nhãn dán dùng thử được thêm vào tài liệu kết quả và tài liệu sẽ được cắt giảm chỉ còn 3 trang đầu. Nếu bạn muốn kiểm tra GroupDocs.Parser mà không bị giới hạn của phiên bản dùng thử, bạn cũng có thể yêu cầu giấy phép tạm thời 30 ngày. Để biết thêm chi tiết, xem.
  • Bạn có những loại giấy phép nào?
    Chúng tôi cung cấp một số loại giấy phép để đáp ứng nhu cầu của các nhà phát triển hoặc công ty cụ thể. Các loại giấy phép phụ thuộc vào số lượng nhà phát triển, số địa điểm nơi các nhà phát triển làm việc và việc bạn có cần cung cấp SDK/API của chúng tôi cho khách hàng cuối hay không. Ngoài ra, bạn có thể chọn giấy phép theo mức sử dụng hàng tháng (Metered) dựa trên lượng sử dụng sản phẩm. Tìm hiểu thêm tại đây.

GroupDocs.Parser API Phân tích Tài liệu low‑code

Tích hợp khả năng phân tích tài liệu vào bất kỳ ứng dụng nào bằng cách sử dụng REST API và SDK dựa trên đám mây của chúng tôi.

GroupDocs.Parser Ứng dụng Phân tích Tài liệu Không cần mã

Các ứng dụng phân tích tài liệu dựa trên web cho phép bạn trích xuất dữ liệu từ hơn 50 định dạng tệp phổ biến trực tiếp trong trình duyệt.

 Tiếng Việt