Broken Link ตัวตรวจสอบ & Cleaner

เกี่ยวกับเครื่องมือนี้

ตัวตรวจและทำความสะอาดลิงก์เสียคืออะไร?

เครื่องมือนี้ดึง URL จากข้อความที่วาง, Markdown, HTML, JSON, CSV, XML, YAML, ไฟล์ข้อความที่อัปโหลด หรือ URL หน้าเว็บ ตรวจลิงก์ HTTP และ HTTPS ในเบราว์เซอร์ แยกประเภทลิงก์เสีย redirect ข้าม timeout และ CORS blocked จากนั้นช่วยลบหรือแทนที่ URL ที่เลือกโดยรักษารูปแบบเนื้อหาเดิมให้มากที่สุด

วิธีใช้

1. วางเนื้อหา อัปโหลดไฟล์ข้อความที่รองรับ หรือใส่ URL หน้าเว็บ 2. เพิ่ม Base URL เมื่อเนื้อหามีลิงก์สัมพัทธ์ เช่น /docs/page 3. คลิกตรวจลิงก์ แล้วตรวจสถานะ URL จำนวนครั้งที่พบ และหมายเหตุข้อจำกัดของเบราว์เซอร์ 4. เลือกเก็บ ลบ หรือแทนที่สำหรับลิงก์เสียแต่ละรายการ หรือใช้การทำงานแบบกลุ่ม 5. คัดลอกหรือดาวน์โหลดเนื้อหาที่ล้างแล้ว รายงาน CSV รายงาน JSON หรือรายงาน Markdown

อินพุตที่รองรับ

รองรับข้อความธรรมดา รายการ URL ดิบ Markdown, HTML, JSON, CSV, XML, YAML, README, ข้อมูล export จาก CMS และไฟล์ที่อ่านได้ซึ่งลงท้ายด้วย .txt, .md, .html, .htm, .csv, .json, .xml, .yml หรือ .yaml โหมด URL เว็บจะดึงหน้าโดยตรงจากเบราว์เซอร์เมื่อเว็บปลายทางอนุญาต

การดึง URL

การดึง URL จะพิจารณารูปแบบก่อน fallback เป็น URL regex ตรวจพบลิงก์และรูปภาพ Markdown, attributes HTML href/src/srcset/action/poster/content, protocol-relative URLs, โดเมน www และ URL HTTP หรือ HTTPS ทั่วไป ลิงก์สัมพัทธ์จะ resolve เฉพาะเมื่อมี Base URL

ตัวเลือกการทำความสะอาด

โหมดการลบควบคุมวิธีเปลี่ยนลิงก์ที่เลือก: ลบเฉพาะ URL, ลบ Markdown หรือ anchor element ทั้งหมดเมื่อทำได้, แทนที่ด้วยค่าว่าง, แทนที่ด้วย null หรือใช้ fallback การล้าง field ที่ปลอดภัย URL แทนที่ต้องเป็นลิงก์ HTTP หรือ HTTPS ที่ถูกต้อง

รายงานและการส่งออก

รายงานมี URL เดิม, URL ที่ normalize, สถานะ, HTTP status code เมื่อมี, URL redirect สุดท้าย, จำนวนครั้ง, action ที่เลือก, replacement URL และเหตุผล คุณสามารถ export เนื้อหาที่ล้างแล้วและรายงานเป็น text, Markdown, CSV หรือ JSON

ความเป็นส่วนตัวและข้อจำกัดของเบราว์เซอร์

ข้อความที่วางและไฟล์ที่อัปโหลดประมวลผลในเบราว์เซอร์ของคุณและไม่ถูกอัปโหลด การตรวจลิงก์และโหมด URL เว็บใช้ browser fetch ดังนั้นบางเว็บไซต์ที่ยังใช้งานได้อาจแสดงเป็น CORS blocked หากไม่อนุญาตการตรวจสถานะจากเบราว์เซอร์ นี่เป็นข้อจำกัดด้านความปลอดภัยของเบราว์เซอร์ ไม่ใช่หลักฐานว่าลิงก์เสีย

ข้อจำกัด

MVP นี้ไม่ใช่ crawler เว็บไซต์เต็มรูปแบบ ไม่ execute หน้าเว็บที่ render ด้วย JavaScript และไม่ใช้ proxy server เพื่อข้าม CORS การทำความสะอาดโครงสร้างซับซ้อน เช่น ลบ field JSON ซ้อนหรือ column CSV จะทำแบบ conservative เพื่อไม่ให้ format เดิมเสียหาย