문서 파서 SDK

개발자 친화적인 Document Parser SDK로 50개 이상의 문서 및 이미지 형식에서 텍스트, 이미지, 바코드, 메타데이터 및 표를 추출합니다.

.NET, Java 및 Python 애플리케이션에 최소한의 코드 작성으로 고성능 문서 파싱을 통합하세요.

유연한 템플릿과 고급 API를 사용해 파싱 규칙을 맞춤 설정하고 정제된 구조화 데이터 출력을 제공합니다.

GroupDocs.Parser 한눈에 보기

PDF, Office 문서, 이미지, 이메일 및 아카이브에서 구조화 및 비구조화 데이터를 추출하는 강력한 Document Parser SDK.

  • 텍스트 추출

    다양한 파일 형식에서 텍스트 정보를 추출합니다

  • 이미지 추출

    다양한 소스에서 시각적 콘텐츠를 가져옵니다

  • 템플릿으로 데이터 파싱

    맞춤 템플릿을 생성하고 이를 사용해 특정 정보를 파싱합니다

  • PDF 양식 파싱

    PDF 양식은 사용자가 입력할 수 있는 필드를 포함한 디지털 문서입니다

GroupDocs.Parser 코드 샘플

C#, Java 및 Python에서 일반적인 GroupDocs.Parser 작업의 몇 가지 사용 사례

PDF 문서에서 텍스트 추출 방법

GroupDocs.Parser API는 몇 단계만 구현하면 문서에서 텍스트를 쉽게 추출할 수 있도록 합니다.
  // 원하는 파일을 전달하여 Parser 클래스의 인스턴스를 생성합니다.
  using (var parser = new Parser("source.pdf"))
  {
      // 텍스트 추출
      using (var textReader = parser.GetText())
      {
          // 추출된 텍스트를 처리합니다.
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // 원하는 파일을 전달하여 Parser 클래스의 인스턴스를 생성합니다.
  try (Parser parser = new Parser("source.pdf"))
  {
      // 텍스트 추출
      try (TextReader reader = parser.getText())
      {
          // 추출된 텍스트를 처리합니다.
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # 원하는 파일을 전달하여 Parser 클래스의 인스턴스를 생성합니다.
  with Parser("source.pdf") as parser:
      # 텍스트 추출
      text = parser.get_text()

      # 추출된 텍스트를 처리합니다.
      print(text)

50개 이상의 문서 및 이미지 형식 지원

GroupDocs.Parser Document Parser SDK는 Office 문서, PDF, 이미지, 이메일, 아카이브 등 다양한 형식에 대한 파싱 작업을 가능하게 합니다.

GroupDocs.Parser 성과

우리 라이브러리 성과의 주요 지표를 확인하세요

  • 50+

    지원되는 포맷

    GroupDocs.Parser는 50개 이상의 인기 파일 포맷을 지원합니다.

  • 1600k

    NuGet 다운로드

    GroupDocs.Parser .NET용 NuGet 패키지는 1,600,000회 이상 다운로드되었습니다.

  • 18k

    Maven 다운로드

    GroupDocs.Parser는 Maven에서 18,000회 다운로드되었습니다. 강력한 Java 파싱 기능.

  • 140+

    만족하는 고객

    유명 기업과 개인 개발자 모두 혁신적인 솔루션을 구축하기 위해 GroupDocs 제품을 선호합니다.

우리의 만족하는 고객

GroupDocs 라이브러리는 전 세계적으로 유명하고 저명한 브랜드에서 사용됩니다.

플랫폼 독립성

GroupDocs.Parser 라이브러리는 다음 운영 체제와 프레임워크를 지원합니다:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

시작할 준비가 되셨나요?

귀하의 플랫폼에서 GroupDocs.Parser 기능을 무료로 사용해 보세요.

유용한 리소스

경험을 향상시키기 위해 문서, 코드 샘플 및 커뮤니티 지원을 탐색하십시오.

자주 묻는 질문

가장 자주 묻는 질문에 대한 답변입니다.

  • GroupDocs.Parser 라이브러리가 문서를 조작하기 위해 다른 타사 소프트웨어가 필요합니까?
    GroupDocs.Parser는 Adobe Acrobat, Microsoft Office 등과 같은 외부 소프트웨어를 설치할 필요가 없습니다.
  • GroupDocs.Parser 라이브러리를 구매하기 전에 체험할 수 있나요?
    예, 라이선스를 구매하지 않고도 GroupDocs.Parser를 체험할 수 있습니다. 라이선스 없이 설치하면 라이브러리는 체험 모드로 작동합니다. 이 모드에서는 결과 문서에 체험 배지가 추가되고 처음 3페이지로 제한됩니다. GroupDocs.Parser를 체험 버전 제한 없이 테스트하려면 30일 임시 라이선스를 요청할 수도 있습니다. 자세한 내용은 자세히 보기를 참고하십시오.
  • 어떤 라이선스를 제공하나요?
    당사는 특정 개발자 또는 기업의 요구에 맞는 다양한 라이선스 유형을 제공합니다. 라이선스 유형은 개발자 수, 개발자 사이트 위치 수, 그리고 SDK/API를 최종 고객에게 제공해야 하는지 여부에 따라 결정됩니다. 또한 제품의 월별 사용량에 기반한 종량제 라이선스를 선택할 수도 있습니다. 자세한 내용은 자세히 보기에서 확인하십시오.
 한국인