Broken Link 检查器 & Cleaner

关于此工具

什么是坏链检查与清理器?

坏链检查与清理器可从粘贴文本、Markdown、HTML、JSON、CSV、XML、YAML、上传的文本文件或网页 URL 中提取 URL。它在浏览器中检查 HTTP 和 HTTPS 链接,标记损坏、重定向、跳过、超时和 CORS 阻止的链接,并帮助你在尽量保留原始内容结构的同时移除或替换选中的 URL。

如何使用

1. 粘贴内容、上传支持的文本文件,或输入网页 URL。 2. 当内容包含 /docs/page 等相对链接时,添加 Base URL。 3. 点击检查链接,查看每个 URL 的状态、出现次数和浏览器限制说明。 4. 对每个坏链选择保留、移除或替换,也可以使用批量操作。 5. 复制或下载清理后的内容、CSV 报告、JSON 报告或 Markdown 报告。

支持的输入

支持纯文本、原始 URL 列表、Markdown、HTML、JSON、CSV、XML、YAML、README 内容、CMS 导出数据,以及 .txt、.md、.html、.htm、.csv、.json、.xml、.yml、.yaml 文件。网页 URL 模式会在目标站点允许时由浏览器直接获取页面。

URL 提取

提取会先按格式识别,再回退到 URL 正则。可检测 Markdown 链接和图片、HTML href/src/srcset/action/poster/content 属性、协议相对 URL、www 域名,以及普通 HTTP 或 HTTPS URL。相对链接仅在提供 Base URL 时解析。

清理选项

移除模式控制选中链接的修改方式:仅移除 URL、尽可能移除完整 Markdown 或 anchor 元素、替换为空值、替换为 null,或使用最近的安全字段清理 fallback。替换 URL 必须是有效的 HTTP 或 HTTPS 链接。

报告与导出

报告包含原始 URL、规范化 URL、状态、可用时的 HTTP 状态码、最终重定向 URL、出现次数、选中操作、替换 URL 和原因。你可以将清理后的内容和报告导出为文本、Markdown、CSV 或 JSON。

隐私与浏览器限制

粘贴文本和上传文件会在浏览器本地处理,不会上传。链接检查和网页 URL 模式使用 browser fetch,因此某些有效站点如果不允许浏览器状态检查,可能显示为 CORS blocked。这是浏览器安全限制,不代表链接一定损坏。

限制

此 MVP 不是完整网站爬虫,不执行 JavaScript 渲染页面,也不使用服务器代理绕过 CORS。删除嵌套 JSON 字段或 CSV 列等复杂结构清理会保持保守,以避免意外破坏原始格式。