HTML to Markdown ตัวแปลง

ต้นฉบับ HTML

บรรทัด: 0 · อักขระ: 0

ผลลัพธ์ Markdown

บรรทัด: 0 · อักขระ: 0

Markdown จะแสดงที่นี่

วาง HTML อัปโหลดไฟล์ หรือดึง URL เพื่อสร้าง Markdown

การประมวลผลทั้งหมดเกิดขึ้นในเบราว์เซอร์ของคุณ ข้อมูลของคุณไม่ถูกส่งไปยังเซิร์ฟเวอร์ของเรา

เกี่ยวกับเครื่องมือนี้

ตัวแปลง HTML เป็น Markdown คืออะไร?

ตัวแปลง HTML เป็น Markdown เปลี่ยน HTML ที่วาง ไฟล์ .html ที่อัปโหลด หรือเว็บเพจที่ดึงมาให้เป็น Markdown ที่สะอาดสำหรับ docs, README, draft บล็อก, changelog และ AI prompts งานวางและอัปโหลดทำงานใน browser ของคุณ ส่วนโหมด URL ใช้ server fetch endpoint ที่มี guard เพื่อแปลงหน้าเว็บโดยไม่ติดปัญหา CORS ของ browser

วิธีใช้

1. เลือกโหมด วาง, URL, อัปโหลด หรือ ตัวอย่าง 2. เพิ่ม HTML โดยตรง อัปโหลดไฟล์ .html หรือ .htm หรือดึง page URL 3. ปรับ formatting, cleaning, main-content extraction, image handling และ relative URL options 4. ตรวจ raw Markdown, preview, statistics และ conversion warnings แล้วคัดลอกหรือดาวน์โหลดผลลัพธ์เป็น .md หรือ .txt

กรณีใช้งาน

ใช้สำหรับย้ายเอกสารเก่า เตรียมเนื้อหาเว็บเพจสำหรับ RAG pipelines ล้าง CMS markup ที่คัดลอกมา สร้าง README sections แปลง release notes หรือเปลี่ยน HTML ของ technical blog เป็น Markdown ที่พกพาได้

Syntax ที่รองรับ

ตัวแปลงรองรับ ATX หรือ Setext headings, bullets แบบ -, * หรือ +, code blocks แบบ fenced หรือ indented, fences แบบ backtick หรือ tilde, emphasis และ strong delimiters, links แบบ inline หรือ reference, GitHub Flavored Markdown tables และการจัดการรูปภาพที่ตั้งค่าได้

ตารางถูกแปลงอย่างไร?

ตาราง HTML แบบง่ายจะถูกแปลงเป็น GitHub Flavored Markdown tables ตารางที่มี merged cells จะถูก flatten เพราะ Markdown ไม่มี colspan หรือ rowspan แบบ native และ conversion report จะแจ้ง limitation นี้

ข้อมูลถูกประมวลผลในเครื่องหรือไม่?

HTML ที่วางและไฟล์ที่อัปโหลดถูกประมวลผลใน browser ของคุณ โหมด URL ส่งเฉพาะ URL ไปยัง guarded fetch endpoint แล้วแปลง HTML ที่ส่งกลับมาใน browser

แปลงเว็บเพจได้หรือไม่?

ได้ โหมด URL สามารถดึงหน้า HTTP และ HTTPS สาธารณะจำนวนมาก แต่ไม่ execute JavaScript ดังนั้นหน้าที่ render เนื้อหาหลัง client-side scripts อาจต้องวาง source HTML แทน

Scripts ถูก execute หรือไม่?

ไม่ Element อย่าง script, style, iframe, object และ embed สามารถถูกลบก่อนแปลง และ scripts จากเว็บเพจที่ดึงมาจะไม่ถูก run

Cleaning และ extraction

Cleaning options สามารถลบ scripts, styles, comments, nav, header, footer, empty tags และ whitespace ที่รบกวนก่อนแปลง Readability mode ใช้ deterministic main-content heuristic เพื่อเลือก article, main, role=main และ blocks ที่มี text สูง

ความปลอดภัยของ URL fetch

โหมด URL รับเฉพาะ HTTP และ HTTPS URLs, follow redirects ที่ตรวจสอบแล้วจำนวนเล็กน้อย, block localhost และ private network ranges, จำกัด HTML input ที่ 2 MB และ timeout หลัง 10 seconds บาง sites block server-side requests หรือ require JavaScript rendering ให้ paste page HTML เมื่อเกิดกรณีนั้น

ข้อจำกัด

Markdown ไม่สามารถแทนทุก HTML layout ได้ ตารางซับซ้อนที่มี merged cells จะถูก flatten, unsupported tags จะกลายเป็น plain content เมื่อทำได้, scripts ไม่ execute, CSS layout ถูก ignore และ Markdown จากหน้าเว็บที่ออกแบบซับซ้อนอาจยังต้องแก้ไขเล็กน้อย