Heim > Backend-Entwicklung > PHP-Tutorial > Was ist der beste Weg, RSS/Atom-Feeds in PHP mit SimpleXML zu analysieren?

Was ist der beste Weg, RSS/Atom-Feeds in PHP mit SimpleXML zu analysieren?

Patricia Arquette
Freigeben: 2024-11-25 15:51:16
Original
769 Leute haben es durchsucht

What's the Best Way to Parse RSS/Atom Feeds in PHP Using SimpleXML?

Bester Weg, RSS-/Atom-Feeds mit PHP zu analysieren

Magpie RSS ist eine beliebte Bibliothek zum Parsen von RSS- und Atom-Feeds in PHP, aber Es ist bekannt, dass es bei fehlerhaften Feeds fehlschlägt. Daher können alternative Optionen erforderlich sein.

Eine der empfohlenen Alternativen ist die Verwendung der in PHP integrierten SimpleXML-Funktionen. SimpleXML bietet eine intuitive Struktur zum Parsen von XML-Dokumenten, einschließlich RSS- und Atom-Feeds. Es erkennt und verarbeitet auch XML-Warnungen und -Fehler. Wenn ein Fehler auftritt, kann die Feed-Quelle mit einem Tool wie HTML Tidy bereinigt werden, bevor versucht wird, sie erneut zu analysieren.

Hier ist eine einfache Klasse, die SimpleXML verwendet, um einen RSS-Feed zu analysieren:

class BlogPost
{
    var $date;
    var $ts;
    var $link;

    var $title;
    var $text;
}

class BlogFeed
{
    var $posts = array();

    function __construct($file_or_url)
    {
        $file_or_url = $this->resolveFile($file_or_url);
        if (!($x = simplexml_load_file($file_or_url)))
            return;

        foreach ($x->channel->item as $item)
        {
            $post = new BlogPost();
            $post->date  = (string) $item->pubDate;
            $post->ts    = strtotime($item->pubDate);
            $post->link  = (string) $item->link;
            $post->title = (string) $item->title;
            $post->text  = (string) $item->description;

            // Create summary as a shortened body and remove images, 
            // extraneous line breaks, etc.
            $post->summary = $this->summarizeText($post->text);

            $this->posts[] = $post;
        }
    }

    private function resolveFile($file_or_url) {
        if (!preg_match('|^https?:|', $file_or_url))
            $feed_uri = $_SERVER['DOCUMENT_ROOT'] .'/shared/xml/'. $file_or_url;
        else
            $feed_uri = $file_or_url;

        return $feed_uri;
    }

    private function summarizeText($summary) {
        $summary = strip_tags($summary);

        // Truncate summary line to 100 characters
        $max_len = 100;
        if (strlen($summary) > $max_len)
            $summary = substr($summary, 0, $max_len) . '...';

        return $summary;
    }
}
Nach dem Login kopieren

Diese Klasse bietet Methoden zum Laden und Analysieren eines RSS-Feeds, zum Extrahieren und Speichern einzelner Beiträge und zum Zusammenfassen von Beitragstexten für Anzeigezwecke. Durch die Verwendung von SimpleXML kann diese Klasse wohlgeformte und fehlerhafte RSS-Feeds effektiv und zuverlässig verarbeiten.

Das obige ist der detaillierte Inhalt vonWas ist der beste Weg, RSS/Atom-Feeds in PHP mit SimpleXML zu analysieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage