PHP-HTML-Parsing: Text zwischen Überschriften extrahieren
In PHP kann das Parsen von HTML-Code durch verschiedene Methoden erfolgen. Beim Umgang mit HTML, das in einer Variablen gespeichert ist, ist es aus Gründen der Zuverlässigkeit ratsam, reguläre Ausdrücke zu vermeiden.
Verwendung des PHP Document Object Model (DOM)
Das PHP DOM bietet eine Strukturierter Ansatz zum Parsen von HTML:
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; $DOM = new DOMDocument; $DOM->loadHTML($str); $items = $DOM->getElementsByTagName('h1'); for ($i = 0; $i < $items->length; $i++) echo $items->item($i)->nodeValue . "<br/>";
Dies wird Ausgabe:
T1 T2 T3
Alternativer Ansatz: Regulärer Ausdruck
Wenn die gewünschte Ausgabe der Text zwischen Überschriften ist, kann ein regulärer Ausdruck verwendet werden:
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; echo preg_replace("#<h1.*?>.*?</h1>#", "", $str);
Dieser Ausdruck entfernt alle HTML-Tags und ruft den Text ab:
Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text zwischen HTML-Überschriften in PHP?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!