HTML to Markdown 转换器

HTML 源码

: 0 · 字符: 0

Markdown 输出

: 0 · 字符: 0

Markdown 将显示在这里

粘贴 HTML、上传文件或获取 URL 以生成 Markdown。

所有处理都在浏览器本地完成。您的数据不会发送到我们的服务器。

关于此工具

什么是 HTML 转 Markdown 转换器?

HTML 转 Markdown 转换器可将粘贴的 HTML、上传的 .html 文件或获取的网页转换为干净的 Markdown,适用于文档、README、博客草稿、changelog 和 AI 提示。粘贴和上传流程在浏览器本地运行,URL 模式使用受保护的服务器 fetch 端点,以避免浏览器 CORS 问题。

如何使用

1. 选择粘贴、URL、上传或示例模式。 2. 直接添加 HTML、上传 .html 或 .htm 文件,或获取页面 URL。 3. 调整格式、清理、主要内容提取、图片处理和相对 URL 选项。 4. 查看原始 Markdown、渲染预览、统计和转换警告,然后复制结果或下载为 .md 或 .txt。

使用场景

可用于迁移旧文档、为 RAG 流程准备网页内容、清理复制的 CMS 标记、构建 README 片段、转换发布说明,或将技术博客 HTML 转为可移植 Markdown。

支持的语法

转换器支持 ATX 或 Setext 标题,-、* 或 + 项目符号,围栏式或缩进式代码块,反引号或波浪线围栏,强调和加粗分隔符,内联或引用链接,GitHub Flavored Markdown 表格,以及可配置的图片处理。

表格如何转换?

简单 HTML 表格会转换为 GitHub Flavored Markdown 表格。带合并单元格的表格会被展平,因为 Markdown 没有原生 colspan 或 rowspan 支持,转换报告会标记此限制。

数据是否在本地处理?

粘贴的 HTML 和上传的文件在浏览器中处理。URL 模式只把 URL 发送到受保护的 fetch 端点,然后在浏览器中转换返回的 HTML。

可以转换网页吗?

可以,URL 模式能获取许多公开 HTTP 和 HTTPS 页面。它不会执行 JavaScript,因此只在客户端脚本运行后才渲染内容的页面可能需要改为粘贴源 HTML。

脚本会执行吗?

不会。script、style、iframe、object 和 embed 元素可在转换前移除,获取网页中的脚本也不会运行。

清理与提取

清理选项可在转换前移除脚本、样式、注释、nav、header、footer、空标签和多余空白。可读性模式使用确定性的主要内容启发式规则,优先选择 article、main、role=main 和文本密度高的内容块。

URL 获取安全性

URL 模式仅接受 HTTP 和 HTTPS URL,跟随少量经过验证的重定向,阻止 localhost 和私有网络地址,将 HTML 输入限制为 2 MB,并在 10 秒后超时。有些网站会阻止服务器端请求或需要 JavaScript 渲染;遇到这种情况请粘贴页面 HTML。

限制

Markdown 无法表示所有 HTML 布局。带合并单元格的复杂表格会被展平,不支持的标签会尽可能变为普通内容,脚本不会执行,CSS 布局会被忽略,高度设计化页面生成的 Markdown 可能仍需少量编辑。