让您的文档具备 AI 能力

Markdown SDK,可将各种文档类型导出为干净、语义化的 Markdown。

保留文档结构、标题、列表、表格、链接和图像

通过嵌入或保存为外部资源来控制图像。

GroupDocs.Markdown 功能集

以下是使我们的解决方案脱颖而出的功能。

  • 将文档导出为 Markdown

    通过将 PDF、Word、Excel、电子书和文本导出为 Markdown,使其准备好用于 LLM。

  • 保持文档结构

    保留文档结构、标题、列表、表格、链接和图像。

  • 控制图像

    嵌入图像或将其保存为外部资源。可在转换过程中替换图像。

  • 转换整个文档或特定页面

    根据需要转换整个文档或仅限于特定页面或工作表。

GroupDocs.Markdown 代码示例

将文档导出为 Markdown 最常见的使用场景。您可以请求获取免费临时许可证以在您的环境中测试本产品。

将 PDF 导出为 Markdown

仅需几行代码,即可从 PDF 文件获取干净的 Markdown 文件。默认情况下,图像会嵌入输出文件中。
// 导入命名空间
using GroupDocs.Markdown;

// 实例化转换器
using var converter = new MarkdownConverter("business-plan.pdf");

// 转换并将输出保存到文件
converter.Convert("business-plan.md");
# 导入命名空间
from groupdocs.markdown import MarkdownConverter

# 转换并将输出保存到文件
MarkdownConverter.to_file("business-plan.pdf", "business-plan.md")

将图像保存到文件夹

此代码示例展示了如何将 DOCX 文件转换为 Markdown 并将图像保存到单独的文件夹中。
// 导入命名空间
using GroupDocs.Markdown;

// 设置许可证
License.Set("GroupDocs.Markdown.lic");

// 实例化转换器
using var converter = new MarkdownConverter("annual-report.docx");

// 设置图像导出策略和输出文件夹
var options = new ConvertOptions
{
    ImageExportStrategy = new ExportImagesToFileSystemStrategy("./images")
    {
        ImagesRelativePath = "images"
    }
};

// 转换并将输出保存到文件
converter.Convert("annual-report.md", options);
# 导入命名空间
from groupdocs.markdown import MarkdownConverter, ConvertOptions
from groupdocs.markdown import ExportImagesToFileSystemStrategy

# 设置图像导出策略和输出文件夹
strategy = ExportImagesToFileSystemStrategy("./images")
strategy.images_relative_path = "images"
options = ConvertOptions()
options.image_export_strategy = strategy

# 转换并将输出保存到文件
MarkdownConverter.to_file(
    "annual-report.docx", "annual-report.md",
    convert_options=options)

检查文档并转换特定页面

在转换之前获取文档元数据,然后仅导出所需的页面——非常适合大型文档和 AI/RAG 流程。
// 导入命名空间
using GroupDocs.Markdown;

// 在不转换的情况下检查文档
DocumentInfo info = MarkdownConverter.GetInfo("report.pdf");
Console.WriteLine($"{info.PageCount} pages, by {info.Author}");

// 仅转换前 3 页并添加 front matter
var options = new ConvertOptions
{
    PageNumbers = new[] { 1, 2, 3 },
    IncludeFrontMatter = true
};

// 使用单行静态方法
MarkdownConverter.ToFile("report.pdf", "report.md", options);
# 导入命名空间
from groupdocs.markdown import MarkdownConverter, ConvertOptions

# 在不转换的情况下检查文档
info = MarkdownConverter.get_info("report.pdf")
print(f"{info.page_count} pages, by {info.author}")

# 仅转换前 3 页并添加 front matter
options = ConvertOptions()
options.page_numbers = [1, 2, 3]
options.include_front_matter = True

# 使用单行静态方法
MarkdownConverter.to_file("report.pdf", "report.md",
    convert_options=options)

支持 30+ 种文件格式

以下文件格式支持导出为 Markdown。

深入的指标和统计洞察

深入了解我们的关键数据,提供全面的指标和统计洞察,展示我们的成就、影响和增长。

  • 30+

    支持的格式

    将包括 PDF、Word、Excel 和电子书在内的数十种文档和文本格式转换为 Markdown,实现与生成式 AI 生态系统的无缝集成。

  • 1.0M

    深受开发者信赖

    我们的解决方案在开发者社区中得到广泛信任和采用,为您的项目提供无缝集成。

  • 15+

    产品

    我们提供超过 15 种文档处理 SDK,让您的集成体验流畅。我们负责处理,您即可轻松使用。

  • 100+

    满意的客户

    为全球最具代表性的品牌提供服务。了解为何数百家企业喜爱 GroupDocs 产品!立即加入!

我们的满意客户

GroupDocs 库被全球知名且有影响力的品牌广泛使用。

支持的平台

GroupDocs.Markdown 支持以下操作系统和框架。

.NET

.NET 6+
.NET Framework 4.6.2+
Windows, Linux
30+ 文件格式

Python

Python 3.5+
Windows, Linux, macOS
30+ 文件格式

准备好开始了吗?

选择您的目标平台以了解更多产品信息。

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

常见问题与关注点

在我们的 FAQ 部分找到常见问题的答案,快速解决您的疑问和关注点。

  • 我可以在购买前评估 GroupDocs 产品吗?
    可以!所有 GroupDocs 产品都提供无风险的评估版。我们强烈鼓励开发者在购买前下载并试用我们的 API,以确保它们能够 100% 满足您的需求。
  • GroupDocs 提供产品演示吗?
    不,我们专注于 API,致力于打造功能最完善、最稳定的产品。我们提供完整功能的免费试用,形式为临时许可证,让您自行测试产品。
  • 我可以从哪里下载产品?
    所有产品均可从 NuGet 或 GroupDocs Releases 网站 下载。
  • GroupDocs 开发者许可证是按用户计费,还是按命名用户计费?
    GroupDocs 开发者许可证按用户计费,而非按命名用户计费。我们理解开发团队成员会随时间变化,频繁更新许可证并不实际。
  • 您是否提供技术支持?
    是的,我们通过产品团队在免费支持论坛付费支持帮助台提供免费技术支持,以确保您的使用体验顺畅。
 中国人