Le langage de description d'une page WWW se nomme HTML. De la documentation est disponible sur le serveur officiel du W3 Consortium: http://www.w3.org
En résumé, une source HTML est composée de lignes de texte comportant des séquences d'échappement (marques, anglais: tags) commençant par suivi du nom de la séquence, par exemple TITLE ou b, d'éventuels paramètres et enfin de . Comme dans LATEX, on se trouve souvent dans un environnement spécifique initialisé par la séquence d'échappement. On quitte l'environnement par /, suivi du nom de la séquence et de . Par exemple, la séquence H1 permet de spécifier un titre de premier niveau, que l'on termine avec /H1. Notez qu'un document HTML peut comporter des accents selon la convention du langage ou les accents standards. La figurefigexamplepagehtml montre un exemple simpliste d'une telle page.
On distinguera entre styles logiques (section, sous-section, etc) et styles physiques (gras, italiques, tailles de générateur de caractères, etc). Le moteur http://validator.w3.org/ permet de valider le code HTML, y compris de versions différentes.