GroupDocs.Parser trong một cái nhìn tổng quan
Document Parser SDK để thực hiện việc phân tích tài liệu độ chính xác cao trong các ứng dụng .NET
Trích xuất dữ liệu từ tài liệu
GroupDocs.Parser for .NET API cho phép bạn lấy văn bản, siêu dữ liệu và hình ảnh từ nhiều định dạng tệp khác nhau như tài liệu Office, email, tệp đính kèm và lưu trữ. Công cụ mạnh mẽ này giúp bạn truy cập và xử lý thông tin quý giá trong các tệp một cách hiệu quả cho các ứng dụng như phân tích dữ liệu, lập chỉ mục công cụ tìm kiếm hoặc hệ thống quản lý nội dung.
Phân tích tài liệu
Trích xuất các thành phần khác nhau như siêu liên kết, bảng, mã QR, mã vạch và dữ liệu từ các biểu mẫu PDF. Đồng thời phân tích bất kỳ thông tin mong muốn nào từ tài liệu bằng cách sử dụng mẫu tùy chỉnh.
Tùy chỉnh kết quả
.NET API cho phép bạn lấy dữ liệu ở nhiều định dạng như thô, có cấu trúc, HTML hoặc Markdown. Ngoài ra, API cung cấp chức năng tìm kiếm để xác định các từ hoặc cụm từ cụ thể trong văn bản tài liệu.

