Was die Struktur von HTML angeht, können viele Leute sie klar erklären:
Ein DOCTYPE, ein HTML, das Kopf- und Körperelemente enthält.
Natürlich kann man das nicht als falsch bezeichnen, aber wenn man fragt, was eine HTML-Quelldatei mindestens enthalten muss, befürchte ich, dass nur wenige Leute die Frage richtig beantworten können.
Beantworten wir zunächst diese Frage. Der für eine einfachste HTML5-Quellcodedatei erforderliche Inhalt lautet wie folgt:
<!DOCTYPE html>
Ja, das ist alles, nicht mehr als eine Zeichen, nicht weniger als ein Zeichen, außer der Groß-/Kleinschreibung, die nach Belieben geändert werden kann, kann kein anderer Inhalt geändert werden.
Was sind also die Regeln, die dazu führen, dass eine einfachste Quellcodedatei eine Doctype-Deklaration hat? Gemäß dem Standard besteht ein HTML-Dokument aus folgendem Inhalt (streng in der Reihenfolge):
Ein BOM-Tag, und dieses BOM-Tag muss U+FEFF sein .
0-n Leerzeichen oder Kommentare.
DOCTYPE-Anweisung.
0-n Leerzeichen oder Kommentare.
Ein HTML-Element.
0-n Leerzeichen oder Kommentare.
Es gibt einige Unterschiede zu HTML4. Die einfachste Quellcodedatei von HTML4 sieht so aus:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <title>这里是标题</title>
Der Unterschied zwischen den beiden ist offensichtlich:
HTML5 ändert den DOCTYPE in einen einfacheren <!DOCTYPE html>
, der bereits bekannt ist.
hat in HTML4 ein zusätzliches <title>
-Tag.
Der entscheidende Punkt hier ist das <title>
-Tag. Der HTML4.01-Standard besagt Folgendes:
Jedes HTML-Dokument muss einen haben TITLE-Element im HEAD-Abschnitt.
Mit anderen Worten: HTML4 erfordert, dass das Tag <title>
vorhanden ist.
Und im HTML5-Standard heißt es:
Es darf nicht mehr als ein Titelelement pro Dokument geben.
HTML5 setzt nur ein Obergrenze für die Anzahl der <title>
-Tags, legt jedoch keine Untergrenze fest. Mit anderen Worten: Ein Dokument ohne <title>
gilt als Rechtsdokument.
Für DOCTYPE sind in HTML4 6 DOCTYPE-Typen festgelegt, und in HTML5 ist DOCTYPE in 3 Typen unterteilt. Dies wird in den folgenden Kapiteln ausführlich erläutert.
Schauen wir uns noch einmal die Zusammensetzung des Dokuments an. Abgesehen von Elementen, die wenig Sinn machen, weist die zusammengesetzte Liste auch darauf hin, dass es ein HTML-Element gibt, aber im einfachsten Quellcode gibt es so etwas nicht . Dies liegt daran, dass es in der HTML-Spezifikation schon immer das Konzept der „impliziten Tags“ gab. In Bezug auf implizite Tags kann es grob wie folgt erklärt werden:
Einige Elemente, wenn bestimmte Voraussetzungen erfüllt sind, Sein Start-Tag oder End-Tag kann im Quellcode weggelassen werden. In diesem Fall wird das ausgelassene Tag als „implizites Tag“ bezeichnet.
Es ist zu beachten, dass sich die Auslassung hier auf die Auslassung von im Quellcode bezieht, und im endgültigen DOM-Baum ist dieses Tag vorhanden, daher wird es als implizites -Tag bezeichnet für . Daher sieht die einfachste Quellcodestruktur oben nach der Generierung des DOM-Baums wie folgt aus:
<!DOCTYPE html> <html>