Dev Tools

Convertisseur HTML vers Markdown

Transformez du HTML en Markdown propre. Titres, listes, liens, images : conversion automatique côté client.

Questions fréquentes

Qu'est-ce que le Markdown ?

Le Markdown est un langage de balisage léger créé par John Gruber en 2004. Il permet de formater du texte avec une syntaxe simple et lisible (# pour les titres, ** pour le gras, - pour les listes).

Il est largement utilisé dans les README GitHub, les wikis, les CMS headless, les éditeurs de notes comme Obsidian et Notion.

Dans quels cas convertir HTML vers Markdown ?

La conversion HTML vers Markdown est utile pour migrer du contenu d'un CMS WordPress vers un CMS headless (Contentful, Strapi, Sanity), pour créer des README GitHub à partir de pages web, pour simplifier du HTML copié-collé depuis un éditeur WYSIWYG, ou pour archiver du contenu dans un format lisible.

Toutes les balises HTML sont-elles supportées ?

Les balises communes sont supportées : titres (h1-h6), paragraphes (p), gras (strong/b), italique (em/i), liens (a), listes (ul/ol/li), code (code/pre), images (img), sauts de ligne (br).

Les balises de mise en page complexe (div, table, form) sont simplifiées ou ignorées car elles n'ont pas d'équivalent direct en Markdown.

Le Markdown résultant sera-t-il parfait ?

La conversion est une bonne base mais peut nécessiter des ajustements manuels selon la complexité du HTML source. Les tableaux HTML, les styles inline, les classes CSS et les attributs personnalisés ne sont pas convertis.

Pour un HTML très structuré, une revue manuelle est recommandée.

Quelle est la différence entre Markdown standard et GitHub Flavored Markdown ?

Le Markdown standard couvre les éléments de base (titres, gras, liens, listes). GitHub Flavored Markdown (GFM) ajoute les tableaux, les cases à cocher, les blocs de code avec coloration syntaxique (``` language) et le strikethrough (~~texte~~).

Notre convertisseur produit du Markdown standard compatible avec les deux.

HTML to markdown converter : comprendre la conversion entre langages de balisage

HTML et Markdown : deux approches du formatage de texte

Le HTML (HyperText Markup Language) et le Markdown sont deux langages de balisage qui servent des objectifs complémentaires. Le HTML, standardisé par le W3C et le WHATWG, est le langage natif du web : il permet de structurer et présenter du contenu dans un navigateur avec un contrôle total sur la mise en page, les styles et l'interactivité. Le Markdown, créé par John Gruber en 2004, est un langage léger conçu pour être lisible tel quel, sans outil de rendu.

La conversion de HTML vers Markdown est utile dans de nombreux contextes : migration de contenu d'un CMS WordPress vers un CMS headless (Contentful, Strapi, Sanity), création de README GitHub à partir de pages web, simplification de code HTML copié depuis un éditeur WYSIWYG, ou archivage de contenu dans un format portable et lisible.

HTML

<strong>

Balisage verbeux, contrôle total

Markdown

**texte**

Syntaxe concise, lisible en brut

Correspondance des éléments HTML et Markdown

La majorité des éléments HTML courants ont un équivalent direct en Markdown. Cependant, le Markdown est volontairement limité : il ne couvre que les éléments de structuration de texte les plus communs.

Couverture de conversion HTML vers Markdown

Titres (h1-h6)
100%
Paragraphes (p)
100%
Gras / Italique
100%
Liens (a)
100%
Listes (ul/ol)
100%
Code (pre/code)
100%
Images (img)
90%
Tableaux (table)
60%
Formulaires (form)
0%

Éléments supportés par le standard CommonMark

CommonMark vs GitHub Flavored Markdown (GFM)

Le CommonMark est la spécification formelle du Markdown standard, publiée pour résoudre les ambiguïtés de la spécification originale de Gruber. GitHub Flavored Markdown (GFM) étend CommonMark avec des fonctionnalités supplémentaires : tableaux, cases à cocher (task lists), blocs de code avec coloration syntaxique, barré (strikethrough) et autolinks. Notre convertisseur produit du Markdown compatible CommonMark, qui fonctionne dans les deux contextes.

Le Markdown standard ne supporte pas les tableaux. Si votre HTML contient des balises <table>, la conversion nécessite GFM ou un post-traitement manuel. Les styles CSS inline et les classes sont toujours ignorés lors de la conversion.

Exemple illustré : migrer du contenu WordPress

Prenons le cas d'une migration de blog WordPress vers un CMS headless utilisant le Markdown.

1
Exporter le HTML

Copier le contenu HTML de l'éditeur WordPress

<h2>Mon article</h2><p>Texte avec <strong>gras</strong>...</p>
2
Convertir en Markdown

Notre outil transforme les balises en syntaxe Markdown

## Mon article\nTexte avec **gras**...
3
Importer dans le CMS

Coller le Markdown dans le nouvel éditeur

Contentful / Strapi / Sanity

2004

Année de création du Markdown par John Gruber, devenu le standard de facto pour la documentation technique

Cas d'usage courants

La conversion HTML vers Markdown est particulièrement utile pour les README GitHub (transformer une page de documentation web en fichier .md), la documentation technique (Docusaurus, VitePress, MkDocs utilisent tous le Markdown), l'archivage de contenu (le Markdown est pérenne, portable et lisible sans logiciel spécifique), et les éditeurs de notes comme Obsidian et Notion. Pour vérifier l'intégrité de vos fichiers Markdown exportés, utilisez notre générateur de hash SHA.

Bonne pratique

Après conversion, relisez toujours le Markdown généré. Les éléments HTML complexes (tableaux imbriqués, div avec classes CSS, SVG) n'ont pas d'équivalent Markdown et seront simplifiés ou supprimés. Ajoutez manuellement les tableaux GFM si nécessaire. Pour minifier le JavaScript associé à vos pages, consultez notre minifieur JavaScript.

Limitations de la conversion

Certains éléments HTML ne peuvent pas être fidèlement convertis en Markdown. Les tableaux complexes (cellules fusionnées, thead/tbody) nécessitent GFM ou du HTML inline dans le Markdown. Les styles CSS (couleurs, tailles, marges) sont perdus car le Markdown sépare strictement le contenu de la présentation. Les formulaires, scripts et éléments interactifs n'ont aucun équivalent. Les attributs HTML (id, class, data-*) sont supprimés.

HTML dans le Markdown

La plupart des renderers Markdown (GitHub, CommonMark) acceptent le HTML inline. Si un élément ne peut pas être converti, vous pouvez conserver le HTML brut dans votre fichier .md. Cependant, certains contextes (emails, Slack) suppriment le HTML inline pour des raisons de sécurité.

Erreurs fréquentes à éviter

  • Convertir sans vérifier le résultat. La conversion automatique est une base, pas un produit fini. Les tableaux, styles et éléments complexes nécessitent toujours une relecture manuelle.
  • Perdre les images lors de la migration. La conversion transforme les balises <img> en syntaxe Markdown ![alt](src), mais les URLs des images doivent rester accessibles. Vérifiez que les liens pointent vers des URLs absolues.
  • Confondre CommonMark et les extensions. Si vous utilisez des fonctionnalités GFM (tableaux, cases à cocher), assurez-vous que votre renderer les supporte. Un renderer CommonMark strict affichera les tableaux en texte brut.
  • Ignorer l'encodage des caractères spéciaux. Les entités HTML (&amp;, &lt;, &gt;) doivent être décodées en caractères normaux dans le Markdown. Notre convertisseur gère les entités courantes automatiquement.
  • Copier du HTML depuis un éditeur WYSIWYG sans nettoyer. Les éditeurs comme Word ou Google Docs génèrent un HTML bourré de styles inline et de balises superflues. Nettoyez d'abord avec un outil de strip HTML avant de convertir.

Sources et références

Dev & Tech

Sources : CommonMark Spec · GitHub Flavored Markdown · MDN Web Docs · Dernière mise à jour : avril 2026.