Broken Link チェッカー & Cleaner

このツールについて

リンク切れチェッカー & クリーナーとは?

リンク切れチェッカー & クリーナーは、貼り付けたテキスト、Markdown、HTML、JSON、CSV、XML、YAML、アップロードしたテキストファイル、または Web ページ URL から URL を抽出します。ブラウザ内で HTTP/HTTPS リンクをチェックし、リンク切れ、リダイレクト、スキップ、タイムアウト、CORS ブロックを分類して、元のコンテンツ構造をできるだけ保ちながら選択した URL を削除または置換できます。

使い方

1. コンテンツを貼り付ける、対応するテキストファイルをアップロードする、または Web ページ URL を入力します。 2. /docs/page のような相対リンクがある場合は Base URL を追加します。 3. リンクをチェックをクリックし、各 URL のステータス、出現回数、ブラウザ制限メモを確認します。 4. 各リンク切れに対して保持、削除、置換を選ぶか、一括操作を使います。 5. クリーン済みコンテンツ、CSV レポート、JSON レポート、Markdown レポートをコピーまたはダウンロードします。

対応入力

プレーンテキスト、生 URL リスト、Markdown、HTML、JSON、CSV、XML、YAML、README コンテンツ、CMS エクスポートデータ、.txt、.md、.html、.htm、.csv、.json、.xml、.yml、.yaml で終わる読み取り可能なファイルに対応します。Web URL モードでは、対象サイトが許可する場合にブラウザからページを直接取得します。

URL 抽出

URL regex にフォールバックする前に、形式に応じた抽出を行います。Markdown のリンク/画像、HTML の href/src/srcset/action/poster/content 属性、protocol-relative URL、www ドメイン、通常の HTTP/HTTPS URL を検出します。相対リンクは Base URL がある場合のみ解決されます。

クリーンアップオプション

削除モードでは、選択したリンクの変更方法を制御します。URL のみ削除、可能な場合は Markdown または anchor 要素全体を削除、空の値に置換、null に置換、または安全なフィールド形式のクリーンアップを使います。置換 URL は有効な HTTP または HTTPS リンクである必要があります。

レポートとエクスポート

レポートには元の URL、正規化 URL、ステータス、利用可能な HTTP ステータスコード、最終リダイレクト URL、出現回数、選択したアクション、置換 URL、理由が含まれます。クリーン済みコンテンツとレポートは、テキスト、Markdown、CSV、JSON としてエクスポートできます。

プライバシーとブラウザ制限

貼り付けたテキストとアップロードしたファイルはブラウザ内でローカル処理され、アップロードされません。リンクチェックと Web URL モードは browser fetch を使うため、有効なサイトでもブラウザベースのステータスチェックを許可しない場合は CORS ブロックとして表示されることがあります。これはブラウザのセキュリティ制限であり、リンク切れの証明ではありません。

制限事項

この MVP は完全な Web サイトクローラーではなく、JavaScript でレンダリングされるページを実行せず、CORS を回避するサーバープロキシも使いません。ネストした JSON フィールドや CSV 列の削除など複雑な構造化クリーンアップは、元の形式を壊さないよう保守的に行います。