Maison > développement back-end > tutoriel php > Tutoriel sur l'utilisation de PHP pour explorer les critiques de films Douban

Tutoriel sur l'utilisation de PHP pour explorer les critiques de films Douban

PHPz
Libérer: 2023-06-14 17:08:02
original
1432 Les gens l'ont consulté

À mesure que le marché du cinéma continue de s’étendre et de se développer, la demande de films est également de plus en plus élevée. En ce qui concerne l'évaluation des films, Douban Film Critics a toujours été un choix plus faisant autorité et plus populaire. Parfois, nous devons également effectuer certaines analyses et traitements sur les critiques de films Douban, ce qui nécessite l'utilisation d'une technologie d'exploration pour obtenir des informations sur les critiques de films Douban. Cet article présentera un didacticiel sur la façon d'utiliser PHP pour explorer les critiques de films Douban pour votre référence.

  1. Obtenir l'adresse de la page du film Douban

Avant d'explorer les critiques du film Douban, vous devez obtenir l'adresse de la page du film Douban. L'adresse de la page du film peut être obtenue via un moteur de recherche ou en accédant directement à l'interface de liste de films de Douban Movies. Par exemple, si nous voulons obtenir l'adresse de la page du film "The Shawshank Redemption", nous pouvons effectuer une recherche sur l'interface de liste de films de Douban Movies, ou nous pouvons saisir directement l'adresse de la page du film dans le navigateur : https:/ /movie.douban.com/subject/ 1292052/.

  1. Utilisez PHP pour accéder à la page du film Douban et obtenir le contenu de la page

PHP fournit la bibliothèque cURL pour l'accès aux pages Web et l'acquisition de données. Voici un exemple de code PHP pour accéder à la page Douban Movie et obtenir le contenu de la page :

$url = 'https://movie.douban.com/subject/1292052/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$html = curl_exec($ch);
curl_close($ch);
echo $html;
Copier après la connexion

Dans le code, l'adresse de la page Douban Movie est d'abord définie, puis la fonction curl_init() est utilisé pour initialiser l'objet cURL. Utilisez ensuite la fonction curl_setopt() pour définir les paramètres de l'objet curl, où CURLOPT_URL définit l'adresse URL consultée et CURLOPT_RETURNTRANSFER définit le résultat de retour sous forme de chaîne. Utilisez ensuite la fonction curl_exec() pour effectuer l'opération d'exploration cURL et attribuez le résultat à la variable $html. Enfin, utilisez la fonction curl_close() pour fermer la session cURL et libérer les ressources associées, puis affichez la valeur de la variable $html.

Exécutez le code ci-dessus pour afficher le contenu HTML de la page du film Douban.

  1. Analyser le contenu HTML de la page de critique du film Douban

Après avoir obtenu le contenu HTML de la page, vous devez utiliser PHP pour analyser le contenu HTML et extrayez-le. Informations sur les critiques de films Douban.

En PHP, vous pouvez utiliser l'extension SimpleXML pour analyser des données XML ou HTML. Ce qui suit est un exemple de code PHP pour analyser le contenu HTML de la page de critique du film Douban et extraire le contenu de la note et de la critique de la critique du film :

$url = 'https://movie.douban.com/subject/1292052/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$html = curl_exec($ch);
curl_close($ch);

// 使用 SimpleXML 解析 HTML 内容
$xml = simplexml_load_string($html);
$ratings = array();
$comments = array();

// 获取影评评分和评论内容
foreach ($xml->xpath('//div[@class="comment-item"]') as $comment) {
    $rating = $comment->div[2]->span[2]->text();
    $comment_content = $comment->div[2]->p->text();
    $ratings[] = (string)$rating;
    $comments[] = (string)$comment_content;
}

print_r($ratings);
print_r($comments);
Copier après la connexion

Dans le code, l'adresse de la page du film Douban est d'abord défini, puis utilisé. Curl accède aux pages et obtient le contenu HTML.

Ensuite, utilisez la fonction simplexml_load_string() pour analyser le contenu HTML dans un objet SimpleXML. Utilisez ensuite la fonction xpath() et l'instruction de requête XPath pour obtenir toutes les informations sur les critiques de films sur la page, utilisez l'instruction foreach pour parcourir chaque critique de film et obtenez les notes et le contenu des commentaires. Enfin, stockez respectivement les notes et les commentaires dans les tableaux $ratings et $comments, et affichez le contenu de ces deux tableaux.

Exécutez le code ci-dessus pour analyser toutes les informations sur la critique du film dans la page de critique du film Douban.

  1. Informations de critique de film de sortie

Ensuite, affichez les informations de critique de film obtenues. Vous pouvez utiliser HTML et CSS pour embellir le contenu de sortie. Ce qui suit est un exemple de code PHP pour embellir et afficher les informations de critique de film sur la page de critique de film Douban :

$url = 'https://movie.douban.com/subject/1292052/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$html = curl_exec($ch);
curl_close($ch);

// 使用 SimpleXML 解析 HTML 内容
$xml = simplexml_load_string($html);
$ratings = array();
$comments = array();

// 获取影评评分和评论内容
foreach ($xml->xpath('//div[@class="comment-item"]') as $comment) {
    $rating = $comment->div[2]->span[2]->text();
    $comment_content = $comment->div[2]->p->text();
    $ratings[] = (string)$rating;
    $comments[] = (string)$comment_content;
}

// 输出美化的影评信息
echo '<style>table, th, td {border: 1px solid black; border-collapse: collapse;} th, td {padding: 5px;}</style>';
echo '<table><tr><th>评分</th><th>评论内容</th></tr>';
for ($i = 0; $i < count($ratings); $i++) {
    echo '<tr><td>' . $ratings[$i] . '</td><td>' . $comments[$i] . '</td></tr>';
}
echo '</table>';
Copier après la connexion

Dans le code, utilisez d'abord curl pour obtenir le contenu HTML de la page de film Douban, et puis utilisez SimpleXML pour analyser le contenu HTML et obtenir les notes et le contenu des critiques de films.

Ensuite, utilisez HTML et CSS pour embellir le contenu de sortie, notamment en ajoutant des styles de tableau, en définissant les en-têtes et le contenu du tableau, et en utilisant une boucle for pour parcourir chaque critique de film et afficher les notes et les commentaires.

Exécutez le code ci-dessus pour afficher les informations de critique de film de la page de critique de film Douban embellie.

Pour résumer, cet article présente un tutoriel sur la façon d'utiliser PHP pour explorer les critiques de films Douban. Grâce à l'apprentissage, les lecteurs peuvent apprendre à utiliser la technologie PHP et cURL pour accéder aux pages Web et capturer des données, ainsi qu'à utiliser les extensions SimpleXML pour analyser le contenu HTML et embellir la sortie.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal