HTML to Markdown конвертер

Источник HTML

Строки: 0 · Символы: 0

Вывод Markdown

Строки: 0 · Символы: 0

Markdown появится здесь

Вставьте HTML, загрузите файл или получите URL, чтобы создать Markdown.

Вся обработка выполняется локально в браузере. Ваши данные не отправляются на наши серверы.

Об этом инструменте

Что такое конвертер HTML в Markdown?

Конвертер HTML в Markdown превращает вставленный HTML, загруженные файлы .html или полученные веб-страницы в чистый Markdown для документации, README, черновиков блогов, changelog и AI-подсказок. Вставка и загрузка выполняются локально в браузере, а режим URL использует защищенный серверный fetch endpoint, чтобы обходить ограничения CORS браузера.

Как использовать

1. Выберите режим вставки, URL, загрузки или примера. 2. Добавьте HTML напрямую, загрузите файл .html или .htm либо получите URL страницы. 3. Настройте форматирование, очистку, извлечение основного контента, обработку изображений и параметры относительных URL. 4. Проверьте raw Markdown, предпросмотр, статистику и предупреждения, затем скопируйте или скачайте результат как .md или .txt.

Сценарии использования

Используйте инструмент для миграции старой документации, подготовки содержимого веб-страниц для RAG-пайплайнов, очистки скопированной CMS-разметки, создания разделов README, конвертации release notes или переноса HTML технического блога в Markdown.

Поддерживаемый синтаксис

Конвертер поддерживает заголовки ATX или Setext, маркеры -, * или +, fenced или indented блоки кода, ограждения backtick или tilde, разделители emphasis и strong, inline или reference ссылки, таблицы GitHub Flavored Markdown и настраиваемую обработку изображений.

Как конвертируются таблицы?

Простые HTML-таблицы преобразуются в таблицы GitHub Flavored Markdown. Таблицы с объединенными ячейками уплощаются, потому что Markdown не имеет встроенной поддержки colspan или rowspan, и отчет конвертации отмечает это ограничение.

Данные обрабатываются локально?

Вставленный HTML и загруженные файлы обрабатываются в браузере. Режим URL отправляет только URL на защищенный fetch endpoint, а затем конвертирует возвращенный HTML в браузере.

Можно ли конвертировать веб-страницы?

Да, режим URL может получать многие публичные страницы HTTP и HTTPS. JavaScript не выполняется, поэтому страницы, которые рендерят контент только после клиентских скриптов, могут требовать вставки исходного HTML.

Выполняются ли скрипты?

Нет. Элементы script, style, iframe, object и embed могут быть удалены перед конвертацией, а скрипты полученных веб-страниц не запускаются.

Очистка и извлечение

Параметры очистки могут удалить скрипты, стили, комментарии, nav, header, footer, пустые теги и лишние пробелы перед конвертацией. Режим readability использует детерминированную эвристику основного контента, отдавая предпочтение article, main, role=main и блокам с высокой плотностью текста.

Безопасность URL fetch

Режим URL принимает только HTTP и HTTPS URL, следует небольшому числу проверенных редиректов, блокирует localhost и приватные сети, ограничивает HTML 2 MB и завершается по таймауту через 10 секунд. Некоторые сайты блокируют серверные запросы или требуют JavaScript-рендеринга; в таких случаях вставьте HTML страницы.

Ограничения

Markdown не может выразить любую HTML-разметку. Сложные таблицы с объединенными ячейками уплощаются, неподдерживаемые теги по возможности становятся обычным контентом, скрипты не выполняются, CSS layout игнорируется, а Markdown для сильно оформленных страниц может требовать ручной правки.