Maison développement back-end Problème PHP Comment lire le code source de la page Web redirigée en PHP

Comment lire le code source de la page Web redirigée en PHP

Mar 31, 2023 am 09:05 AM

PHP est un langage de script côté serveur largement utilisé qui aide les développeurs à créer des applications Web dynamiques. Cependant, les développeurs PHP ont parfois besoin de lire le code source d'une page Web externe, qui peut être un lien de saut. Dans cet article, nous allons apprendre à utiliser PHP pour lire le code source d'un lien de redirection.

Remarque : dans cet article, nous supposerons que vous êtes déjà familier avec le langage PHP et que vous avez une compréhension de base des protocoles HTML et HTTP.

Étape 1 : Ouvrez le lien à l'aide de cURL

cURL est une bibliothèque de traitement des URL en PHP. Afin de lire le code source de la page Web liée, nous devons utiliser cURL pour ouvrir le lien. Voici le code de base pour utiliser cURL pour ouvrir une page Web en PHP :

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$output = curl_exec($ch);
curl_close($ch);
Copier après la connexion

Dans le code ci-dessus, nous définissons d'abord l'adresse du lien de la page Web à lire, puis créons un handle cURL, définissons l'option d'accès le lien, envoyez la demande cURL et obtenez le résultat de la réponse. Le résultat est enregistré dans la variable $output.

Étape 2 : Gérer les liens de saut

Dans certains cas, le lien que nous ouvrons peut être un lien de saut, ce qui signifie qu'il redirigera vers un autre lien. Afin d'obtenir le code source de la page Web redirigée, nous devons vérifier les informations d'en-tête de réponse pour déterminer s'il existe un en-tête Location. S'il existe, cela signifie qu'il s'agit d'un lien de saut et que l'adresse du lien redirigé est stockée dans Location. Nous devons utiliser cURL pour ouvrir ce lien redirigé afin d'obtenir le code source.

Voici l'exemple de code :

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);

if ($info['http_code'] == 301 || $info['http_code'] == 302) {
    $url = $info['redirect_url'];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $output = curl_exec($ch);
    curl_close($ch);
}
Copier après la connexion

Dans le code ci-dessus, nous avons ajouté une option curl_setopt : CURLOPT_FOLLOWLOCATION. Cette option indique à cURL de suivre les messages de redirection et d'ouvrir automatiquement de nouveaux liens. Ensuite, nous obtenons les informations d’en-tête de réponse et déterminons s’il existe des informations de redirection. S'il existe, nous utilisons la fonction curl_init() pour créer un nouveau handle cURL, ouvrir le lien de redirection et obtenir le code source.

Étape 3 : Analyser le code source

Après avoir obtenu le code source de la page Web, nous devons l'analyser davantage afin de pouvoir traiter les données. Nous pouvons utiliser la classe DOMDocument intégrée de PHP pour analyser les documents HTML.

Ce qui suit est un exemple de code :

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);

if ($info['http_code'] == 301 || $info['http_code'] == 302) {
    $url = $info['redirect_url'];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $output = curl_exec($ch);
    curl_close($ch);
}

$doc = new DOMDocument();
@$doc->loadHTML($output);
$elements = $doc->getElementsByTagName('html');
$title = $doc->getElementsByTagName('title')->item(0)->nodeValue;
Copier après la connexion

Dans le code ci-dessus, nous créons d'abord un objet DOMDocument, puis appelons la fonction loadHTML() pour transmettre le code source de la page Web obtenu en tant que paramètre. Ensuite, nous utilisons la fonction getElementsByTagName() pour obtenir l'élément spécifié et l'attribut nodeValue pour obtenir le contenu textuel de l'élément. Dans cet exemple, nous obtenons l’élément HTML et l’élément title.

Étape 4 : Traiter les données

Enfin, nous pouvons traiter les données obtenues et les stocker ou les afficher selon les besoins. Voici un exemple simple :

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);

if ($info['http_code'] == 301 || $info['http_code'] == 302) {
    $url = $info['redirect_url'];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $output = curl_exec($ch);
    curl_close($ch);
}

$doc = new DOMDocument();
@$doc->loadHTML($output);
$title = $doc->getElementsByTagName('title')->item(0)->nodeValue;
echo "源码标题是:" . $title . "\n";
echo "HTML源码是:" . $output;
Copier après la connexion

Dans le code ci-dessus, nous obtenons d'abord le titre de la page Web, puis produisons directement le code source HTML.

Conclusion

Dans cet article, nous avons appris à utiliser PHP pour lire le code source de la page Web redirigée. En utilisant cURL pour ouvrir des liens, traiter les liens de saut, analyser les documents HTML et traiter les données, nous pouvons facilement lire le code source des liens de saut de la page Web. Il s'agit d'une compétence très utile lorsque vous devez utiliser des robots d'exploration Web, l'analyse de données, l'exploration de données et d'autres scénarios.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

OWASP Top 10 PHP: Décrivez et atténue les vulnérabilités communes. OWASP Top 10 PHP: Décrivez et atténue les vulnérabilités communes. Mar 26, 2025 pm 04:13 PM

L'article traite des 10 meilleures vulnérabilités de l'OWASP dans les stratégies PHP et d'atténuation. Les problèmes clés incluent l'injection, l'authentification brisée et les XS, avec des outils recommandés pour surveiller et sécuriser les applications PHP.

PHP 8 JIT (juste à temps) Compilation: comment cela améliore les performances. PHP 8 JIT (juste à temps) Compilation: comment cela améliore les performances. Mar 25, 2025 am 10:37 AM

La compilation JIT de PHP 8 améliore les performances en compilant le code fréquemment exécuté en code machine, bénéficiant aux applications avec des calculs lourds et en réduisant les temps d'exécution.

Téléchargements de fichiers sécurisés PHP: prévention des vulnérabilités liées au fichier. Téléchargements de fichiers sécurisés PHP: prévention des vulnérabilités liées au fichier. Mar 26, 2025 pm 04:18 PM

L'article traite de la sécurisation des téléchargements de fichiers PHP pour éviter les vulnérabilités comme l'injection de code. Il se concentre sur la validation du type de fichier, le stockage sécurisé et la gestion des erreurs pour améliorer la sécurité de l'application.

Encryption PHP: cryptage symétrique vs asymétrique. Encryption PHP: cryptage symétrique vs asymétrique. Mar 25, 2025 pm 03:12 PM

L'article traite du cryptage symétrique et asymétrique en PHP, en comparant leur aptitude, leurs performances et leurs différences de sécurité. Le chiffrement symétrique est plus rapide et adapté aux données en vrac, tandis que l'asymétrique est utilisé pour l'échange de clés sécurisé.

Authentification PHP & amp; Autorisation: mise en œuvre sécurisée. Authentification PHP & amp; Autorisation: mise en œuvre sécurisée. Mar 25, 2025 pm 03:06 PM

L'article examine la mise en œuvre d'authentification et d'autorisation robustes dans PHP pour empêcher un accès non autorisé, détaillant les meilleures pratiques et recommandant des outils d'amélioration de la sécurité.

Protection PHP CSRF: comment empêcher les attaques du CSRF. Protection PHP CSRF: comment empêcher les attaques du CSRF. Mar 25, 2025 pm 03:05 PM

L'article traite des stratégies pour prévenir les attaques du CSRF dans PHP, notamment en utilisant des jetons CSRF, des cookies de même site et une bonne gestion de session.

Limitation du taux de l'API PHP: stratégies de mise en œuvre. Limitation du taux de l'API PHP: stratégies de mise en œuvre. Mar 26, 2025 pm 04:16 PM

L'article traite des stratégies de mise en œuvre de la limitation du taux d'API en PHP, y compris des algorithmes comme un godet de jeton et un seau qui fuit, et en utilisant des bibliothèques comme Symfony / Rate-Limiter. Il couvre également la surveillance, l'ajustement dynamiquement des limites de taux et la main

Validation d'entrée PHP: meilleures pratiques. Validation d'entrée PHP: meilleures pratiques. Mar 26, 2025 pm 04:17 PM

L'article traite des meilleures pratiques pour la validation des entrées PHP pour améliorer la sécurité, en se concentrant sur des techniques telles que l'utilisation de fonctions intégrées, une approche de liste blanche et une validation côté serveur.

See all articles