GroupDocs Python SDK — краткий обзор

Конвертируйте, объединяйте, сравнивайте, подписывайте и редактируйте популярные форматы документов, такие как PDF, Word и Excel, используя один SDK‑пакет, см. обзор продукта для получения более подробной информации.

Illustration total

Объедините возможности нескольких пакетов GroupDocs в едином готовом к корпоративному использованию решении

GroupDocs.Total for Python через .NET объединяет возможности всех основных API GroupDocs — Conversion, Merger, Signature и Comparison — в один интегрированный набор инструментов.

Автоматизируйте сложные рабочие процессы, такие как конвертация Word‑файлов в PDF, объединение отчетов, применение защищённых цифровых подписей или сравнение версий контрактов — всё в едином процессе.

Такой единый подход экономит время, сокращает усилия разработки и упрощает управление документами во всей организации.

Освойте разнообразие форматов файлов

Получите бесшовную совместимость с более чем 200 типами файлов, включая Word, Excel, PDF, PowerPoint, изображения, чертежи CAD, а также электронные письма или файлы кода. GroupDocs.Total гарантирует безупречную работу ваших решений практически с любым форматом, используемым в деловой среде.

Кроссплатформенность и масштабируемость по замыслу

Развёртывайте уверенно на Windows, Linux или macOS — в любом месте, где работает Python. .NET‑базированная архитектура GroupDocs.Total обеспечивает высокую производительность и масштабируемость для корпоративных нагрузок, будь то локальное выполнение, в контейнерах или в облаке.

Независимость от платформы

GroupDocs.Total для Python через .NET поддерживает следующие операционные системы, фреймворки и менеджеры пакетов; подробнее см. системные требования для получения более подробной информации.

Amazon
Docker
Azure
VS Code
Eclipse
macOS
Linux
PyPI

Поддерживаемые форматы файлов

GroupDocs.Total для Python через .NET поддерживает операции со следующими форматами файлов.

Форматы Microsoft Office, OpenDocument и текстовые форматы

  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM, RTF, TXT
  • Excel: XLS, XLSX, XLSM, XLSB, XLTM, XLT, XLTM, XLTX
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM
  • Project: MPP, MPT, MPX
  • Outlook: MSG, EML, EMLX, PST, OST
  • OneNote: ONE
  • OpenDocument: ODT, OTT, ODS, ODP, OTP, OTS, ODG
  • Fixed Page Layout: PDF, TEX, XPS, OXPS
  • e-Books: EPUB, MOBI, DjVu
  • Delimiter-Separated Values: CSV, TSV

Изображения, графика и диаграммы

  • Растровые изображения: BMP, GIF, JPG, PNG, TIFF, WebP, DNG, DIB, Jpeg2000 family
  • Windows Icon: ICO
  • Scalable Vector Graphics: SVG, CDR, CMX, IGS, SVGZ
  • Adobe Photoshop: PSD, PSB
  • Stereo Lithography (3D Printing): STL
  • Medical Imaging: DICOM
  • Plotter Documents: PLT, HPG
  • Autodesk Design Web Formats: DWF, DWG
  • AutoCAD Drawing: DWT, IFC, STL, CF2

Прочие

  • Веб: HTML, MHT, MHTML, XML
  • Metafile: WMF, EMF, CGM, EMZ, WMZ
  • Visio: VSD, VDX, VSS, VSSX, VSX, VST, VSTX, VTX, VSDX, VDW, VSTM, VSSM, VSDM
  • Project: MPP, MPT, MPX
  • PostScript: PS, EPS
  • Архивы: ZIP, TAR, BZ2, GZ, RAR, RAR5
  • Прочие: VCF, VCARD, NUMBERS, NSF, OBJ
  • C/C++/C# Files: C, CC, C# , CPP, CXX, CS, H, HH, M, MM
  • Java/JavaScript Files: JAVA, JS, JSON, PROPERTIES

Ключевые возможности

Полный набор функций обработки документов — просмотр, конвертация, сравнение и управление PDF и Office‑файлами в масштабах. Ознакомьтесь с быстрым руководством, чтобы узнать, как интегрировать его в ваши приложения.

Feature icon

Конвертация форматов

Точная конвертация сотен типов файлов с сохранением разметки, шрифтов и метаданных. Поддерживает пакетную обработку, потоковую передачу и серверные рабочие процессы для производственных систем.

Feature icon

Безопасный просмотр файлов

Высококачественный рендеринг более чем 180 форматов в HTML, PDF, PNG и JPEG. Встраиваемые компоненты просмотрщика для веба и настольных приложений с настраиваемым управлением доступа и постраничной навигацией.

Feature icon

Сравнение содержимого

Точное пошаговое и встроенное сравнение, выделяющее изменения в содержимом, форматировании и макете, и генерирующее практичные отчёты об изменениях для проверки и аудита.

Feature icon

Управление водяными знаками

Программное наложение и извлечение водяных знаков с поддержкой текстовых/изображений штампов, условных правил применения и аудиторского логирования для соответствия требованиям.

Feature icon

Управление метаданными

Надёжное чтение/запись и нормализация метаданных в разных форматах, с пакетными операциями и рабочими процессами на основе политик для повышения поисковой доступности и управления.

Feature icon

Объединение документов

Объединяйте несколько документов (поддерживаются смешанные типы) в единый индексируемый результат с упорядочиванием на уровне страниц, разрешением конфликтов и опциями формата вывода.

Feature icon

Генерация на основе шаблонов

Автоматическое создание документов из шаблонов и внешних данных (JSON, XML, базы данных), позволяющее генерировать повторяемые, аудируемые отчёты и персонализированные документы в масштабе.

Feature icon

Редакция текста

Точная, необратимая редакция с использованием regex, fuzzy matching и обнаружения с учётом синонимов. Поддерживает как визуальное сокрытие, так и полное удаление из базовых данных документа.

Feature icon

Гибкость подписей

Поддержка электронных и цифровых подписей (PKI), штампов‑изображений/текста и проверочных рабочих процессов — интегрируемо в конвейеры подписания и аудиторские цепочки.

Реальные сценарии работы с документами

Практические сценарии, демонстрирующие, как использовать GroupDocs в повседневных рабочих процессах с документами.

Объединить два файла DOCX и конвертировать объединённый DOCX в PDF

Бизнес‑потребность: Объедините несколько исходных документов в единый, портативный пакет (например: формы ввода, согласования или сборку разделов контракта) и создайте конечный PDF для распространения или архивации.

Используемые продукты: GroupDocs.Merger + GroupDocs.Conversion

Результат: Создаёт единый PDF, готовый к печати и архивированию, с сохранённым макетом и метаданными — уменьшает ручную сборку, упрощает проверку и обеспечивает единообразный вывод для последующих систем.

Python

import os
from groupdocs.merger import License as MergerLicense, Merger
from groupdocs.conversion import License as ConversionLicense, Converter
from groupdocs.conversion.options.convert import PdfConvertOptions, PdfFormats

# Применить лицензию
license_path = os.path.abspath("./GroupDocs.Total.lic")
if os.path.exists(license_path):
    merger_license = MergerLicense()
    merger_license.set_license(license_path)

    conversion_license = ConversionLicense()
    conversion_license.set_license(license_path)

# Объединить два файла DOCX в единый документ
with Merger("./part-a.docx") as merger:
    merger.join("./part-b.docx")
    merger.save("./output-merged.docx")

# Преобразовать объединённый DOCX в PDF (PDF/A‑2b для соответствия архивным требованиям)
with Converter("./output-merged.docx") as converter:
    options = PdfConvertOptions()
    options.pdf_options.pdf_format = PdfFormats.PDF_A_2B
    converter.convert("./final-delivery.pdf", options)

Извлечение текста, миниатюр и метаданных для индексации

Бизнес‑потребность: Автоматически извлекать поисковый текст, визуальные превью и структурированные метаданные из загруженных документов для обеспечения поиска, предварительного просмотра и классификации контента в корпоративном индексе.

Используемые продукты: GroupDocs.Viewer + GroupDocs.Metadata

Результат: Обеспечивает более быструю находку документов и более богатый пользовательский интерфейс поиска (текст + миниатюра + метаданные), повышает релевантность и автоматизирует последующие рабочие процессы, такие как тегирование, маршрутизация или классификация на основе машинного обучения.

Python

import os
from groupdocs.viewer import License as ViewerLicense, Viewer
from groupdocs.viewer.options import HtmlViewOptions
from groupdocs.metadata import License as MetadataLicense, Metadata
from groupdocs.metadata.search import AnySpecification

# Применить лицензию
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    viewer_license = ViewerLicense()
    viewer_license.set_license(license_path)

    metadata_license = MetadataLicense()
    metadata_license.set_license(license_path)

# Отрисовать первую страницу в HTML (или изображение) для предварительного просмотра/миниатюры
with Viewer("bussiness-plan.docx") as viewer:
    view_options = HtmlViewOptions.for_embedded_resources()
    viewer.view(view_options, [1]) 

# Считать метаданные (заголовок, автор, пользовательские свойства)
with Metadata("bussiness-plan.docx") as metadata:
   props = metadata.find_properties(AnySpecification())
   for prop in props:
       print(prop.name, prop.value)

Сравнить две версии бизнес‑предложения, создать отчёт об изменениях и скрыть персональную информацию

Бизнес‑потребность: Бизнес‑предложения часто проходят несколько ревизий. Важно быстро определить, что изменилось, и удалить чувствительные контактные данные, такие как имена, электронные письма или номера телефонов, перед внешним распространением документа.

Используемые продукты: GroupDocs.Comparison + GroupDocs.Redaction

Результат: Результатом является чёткий отчёт об изменениях, выделяющий все правки между версиями предложения, при этом контактная информация надёжно скрыта для безопасного и соответствующего требованиям распространения.

Python

import os
from groupdocs.comparison import License as ComparisonLicense, Comparer
from groupdocs.redaction import License as RedactionLicense, Redactor
from groupdocs.redaction.options import SaveOptions
from groupdocs.redaction.redactions import ReplacementOptions, RegexRedaction

# Применить лицензию
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    comparison_license = ComparisonLicense()
    comparison_license.set_license(license_path)

    redaction_license = RedactionLicense()
    redaction_license.set_license(license_path)

# Сравнить две версии документа
with Comparer("./proposal_v1.docx") as comparer:
    comparer.add("./proposal_v2.docx")
    comparer.compare("./proposal_diffs.docx")

# Определить шаблоны для скрытия личной и корпоративной информации
replacement_options = ReplacementOptions("[REDACTED]")
phone_pattern = r"\b(?:\+?1[-.\s]?)?(?:\(?\d{3}\)?[-.\s]?)\d{3}[-.\s]?\d{4}\b"
email_pattern = r"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}"

# Определить редактирования для применения
redactions = [
    RegexRedaction(email_pattern, replacement_options),
    RegexRedaction(phone_pattern, replacement_options),
]

# Применить редактирование к документу
with Redactor("./proposal_diffs.docx") as redactor:
    for redaction in redactions:
        redactor.apply(redaction)

    # Установите параметры сохранения, чтобы сохранить исходный формат файла
    save_options = SaveOptions()
    save_options.add_suffix = True
    save_options.rasterize_to_pdf = False
    save_options.redacted_file_suffix = "redacted"

    # Сохранить отредактированный документ
    redactor.save(save_options)

Готовы начать?

Загрузите GroupDocs.Total бесплатно или получите пробную лицензию для полного доступа!

Полезные ресурсы

Изучите документацию, примеры кода и раздел поддержки, чтобы улучшить ваш опыт.

Советы по временной лицензии

1
Зарегистрируйтесь, используя ваш рабочий e-mail адрес. Бесплатные почтовые сервисы запрещены.
2
Используйте кнопку Получить временную лицензию на втором шаге.
 Русский