SDK Trình Phân Tích Tài Liệu thân thiện với nhà phát triển, cho phép trích xuất văn bản, hình ảnh, mã vạch, metadata và bảng từ hơn 50 định dạng tài liệu và hình ảnh.
Tích hợp việc phân tích tài liệu hiệu năng cao vào các ứng dụng .NET, Java và Python của bạn với nỗ lực mã hóa tối thiểu.
Sử dụng các mẫu linh hoạt và API nâng cao để tùy chỉnh quy tắc phân tích và cung cấp đầu ra dữ liệu sạch, có cấu trúc.
SDK Trình Phân Tích Tài Liệu mạnh mẽ để trích xuất dữ liệu có cấu trúc và không có cấu trúc từ PDF, tài liệu Office, hình ảnh, email và lưu trữ.
Trích xuất thông tin văn bản từ nhiều định dạng tệp
Lấy nội dung hình ảnh từ các nguồn đa dạng
Tạo mẫu tùy chỉnh và sử dụng chúng để phân tích thông tin cụ thể
Biểu mẫu PDF là tài liệu kỹ thuật số có các trường có thể điền để người dùng tương tác
Một số trường hợp sử dụng điển hình của các thao tác GroupDocs.Parser trong C#, Java và Python
// Tạo một thể hiện của lớp Parser và truyền tệp mong muốn
using (var parser = new Parser("source.pdf"))
{
// Trích xuất văn bản
using (var textReader = parser.GetText())
{
// Xử lý văn bản đã trích xuất
Console.WriteLine(textReader?.ReadToEnd());
}
}
// Tạo một thể hiện của lớp Parser và truyền tệp mong muốn
try (Parser parser = new Parser("source.pdf"))
{
// Trích xuất văn bản
try (TextReader reader = parser.getText())
{
// Xử lý văn bản đã trích xuất
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
from groupdocs.parser import Parser
# Tạo một thể hiện của lớp Parser và truyền tệp mong muốn
with Parser("source.pdf") as parser:
# Trích xuất văn bản
text = parser.get_text()
# Xử lý văn bản đã trích xuất
print(text)
SDK Trình Phân Tích Tài Liệu GroupDocs.Parser cho phép thực hiện các thao tác phân tích trên tài liệu Office, PDF, hình ảnh, email, lưu trữ và hơn thế nữa.
Khám phá các chỉ số chính về thành tựu của thư viện của chúng tôi
GroupDocs.Parser hỗ trợ các thao tác với hơn 50 định dạng tệp phổ biến.
Gói NuGet GroupDocs.Parser cho .NET đã được tải xuống hơn 1.600.000 lần.
GroupDocs.Parser đã có 18.000 lượt tải xuống trên Maven. Tính năng phân tích Java mạnh mẽ.
Các công ty nổi tiếng cũng như các nhà phát triển cá nhân đều ưu tiên các sản phẩm của GroupDocs để xây dựng các giải pháp sáng tạo.
GroupDocs được các thương hiệu danh tiếng và nổi tiếng trên toàn cầu sử dụng.
Thư viện GroupDocs.Parser hỗ trợ các hệ điều hành và framework sau:
Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.
Câu trả lời cho các câu hỏi thường gặp nhất.
Tích hợp khả năng phân tích tài liệu vào bất kỳ ứng dụng nào bằng cách sử dụng REST API và SDK dựa trên đám mây của chúng tôi.
Các lệnh cURL cho API Đám mây phân tích tài liệu RESTful để phân tích tài liệu trên nhiều định dạng tệp phổ biến được hỗ trợ.
Trích xuất hình ảnh, văn bản, thông tin tài liệu hoặc thậm chí phân tích bất kỳ tài liệu nào bằng mẫu do người dùng định nghĩa trong các ứng dụng Microsoft .NET của bạn.
SDK đám mây cho các nhà phát triển Java để phân tích tài liệu, trích xuất thông tin và dữ liệu tài liệu trong các ứng dụng dựa trên Java.
Các ứng dụng phân tích tài liệu dựa trên web cho phép bạn trích xuất dữ liệu từ hơn 50 định dạng tệp phổ biến trực tiếp trong trình duyệt.
Ứng dụng trực tuyến miễn phí để phân tích Word, Excel, PowerPoint, PDF và hơn 50 loại tài liệu khác.
Phân tích tài liệu Word trực tiếp từ trình duyệt web của bạn để trích xuất hình ảnh, văn bản hoặc siêu dữ liệu.
Ứng dụng phân tích PDF miễn phí hoạt động trên bất kỳ nền tảng hoặc thiết bị nào mà không có bất kỳ giới hạn nào.