Mint azt a második fejezetben láttuk, egy HTML-file működik viszonylag egyszerű szerkezettel is. Elég, ha deklaráljuk, hogy HTML-ről van szó, valamint felvesszük a fejlécet és a törzset:
Sőt, igazából még ezek is elhagyhatók. Ha a világ első HTML dokumentumának forrásszövegére tekintünk, azt látjuk, hogy még a fent említett elemeket sem tartalmazza, mégis a legtöbb böngésző helyesen jeleníti meg..
Mégis, ha közelíteni szeretnénk a szabványhoz dokumentumunkat, három elemet helyezzünk el benne: ezek a DOCTYPE, a fejléc és a törzs.
A DOCTYPE elem egy DTD deklaráció. Ez adja meg azt, hogy milyen elemeket és attribútumokat használhatunk a HTML egyes részeiben A DOCTYPE két dologra való, a webböngészők arra használják, hogy meghatározzák a renderelési módot a weblap megjelenítéséhez, az un. jelölés validátorok pedig ennek alapján határozzák meg, hogy milyen szabályokat kell ellenőrizniük a dokumentumban.
XHTML 1.0 deklarációk
HTML 4.01 deklarációk
Strict: Ez a mód nem enged le a pontosságból, mindent betű szerint ellenőriz.
Transitional: amolyan "átmeneti" szigorúság XHTML esetén. Ez azt jelenti, hogy nem kezeli olyan szigorral a kétesebb dolgokat.
Frameset: a frame-ekre bontott oldalakra való, hogy azokat helyesen kezeljék a böngészők. Felolvasó szoftvereknél, szöveges böngészőknél és keresőgépeknél így is problémát okoz.
A HTML nyelv <head> elemérol van szó. Bár a HTML 4 Ajánlás nem jelöli használatát explicit módon kötelezőnek, mégis minden HTML dokumentumnak tartalmaznia kell, ugyanis a HEAD elem tartalmazza a kötelező TITLE elemet. Ezért egy jól struktúrált és érvényes oldalnak elengedhetetlen része. A <head> elem tartalma nem jelenik meg közvetlenül a böngészőterületen, ugyanis olyan információkat (metaadatokat) tartalmaz a dokumentumról, mint a cím (ez azért megjelenik, ha nem is a dokumentum részeként), információ a szerzőröl, a dokumentum típusáról és karakterkódolásáról, adatok a keresők részére (kulcsszavak, nyelv, indexelési kérelmek) és kapcsolt külső állományok (JavaScript, CSS, ikon).
Lássunk egy példát, konkrétan e honlap fejlécét:
A HEAD elemek információkat tartalmaznak a dokumentumról. A benne megadott információk a cím kivételével rejtettek a felhasználó számára. Tartalma lehet: Pontosan egy TITLE elem, szabadon választható BASE és ISINDEX elemek, nulla vagy több SCRIPT, STYLE, META, LINK vagy OBJECT elem.
A HEAD elemeket két csoportra oszthatjuk, az egyik csoport az oldal fizikai értelmezésével kapcsolatos információt közöl, például a karakterkészletet, a nyelvet, az érvényesség lejárati dátumát, a másik a dokumentumot inkább tartalmi oldalról jellemzi, pl. az oldal rövid leírása, a szerző és kulcsszavak.
A HTML törzs <body> tartalmazza a megjelenítendő információkat. Itt van minden amit látunk, szöveg, képek, linkek stb.