Pratique pratique du robot d'exploration : utiliser PHP pour explorer les informations boursières-tutoriel php-php.cn

Table des matières

Travail de préparation

Programmation

Test du programme

Optimisation du programme

Référence

Maison

développement back-end

tutoriel php

Pratique pratique du robot d'exploration : utiliser PHP pour explorer les informations boursières

王林

Jun 13, 2023 pm 05:32 PM

php 爬虫股票

La bourse a toujours été un sujet de grande préoccupation. Les hausses, baisses et variations quotidiennes des actions affectent directement les décisions des investisseurs. Si vous souhaitez comprendre les derniers développements du marché boursier, vous devez obtenir et analyser les informations boursières en temps opportun. La méthode traditionnelle consiste à ouvrir manuellement les principaux sites Web financiers pour afficher les données boursières une par une. Cette méthode est évidemment trop lourde et inefficace. À l’heure actuelle, les robots d’exploration sont devenus une solution très efficace et automatisée.

Ensuite, nous montrerons comment utiliser PHP pour écrire un programme simple d'analyse boursière afin d'obtenir des données boursières.

Travail de préparation

Avant d'écrire le programme de robot d'exploration, vous devez préparer le travail suivant :

Installer l'environnement de développement PHP
Installer la bibliothèque de requêtes HTTP liée à PHP
Comprendre les connaissances de base du HTML DOM
Être familier avec la syntaxe XPath

Parmi eux, la bibliothèque de requêtes HTTP est utilisée pour envoyer des requêtes HTTP afin d'obtenir le code source HTML du site Web cible ; HTML DOM est utilisé pour analyser et parcourir les pages HTML ; Documents XML et HTML.

Programmation

Avant de commencer à écrire le programme d'exploration, nous devons connaître l'URL du site Web cible et le code stock qui doit être obtenu. En prenant Sina Finance comme exemple, l'URL de ses données boursières est la suivante :

http://finance.sina.com.cn/realstock/company/sh600000/nc.shtml

Copier après la connexion

Parmi elles, sh600000 représente le code boursier de la Bourse de Shanghai. De même, le code boursier de la Bourse de Shenzhen commence par sz. Nous pouvons créer une URL basée sur le code stock dont nous avons besoin et utiliser la bibliothèque de requêtes HTTP pour obtenir le code source HTML.

Après avoir obtenu le code source HTML, nous devons utiliser l'analyseur HTML DOM pour analyser la page HTML et utiliser la syntaxe XPath pour filtrer les données boursières requises. Dans cet exemple, nous devons filtrer le nom et le prix actuel de l'action.

Enfin, nous pouvons imprimer les données de stock obtenues. Le code spécifique est le suivant :

$code = 'sh600000'; // 股票代码
$url = 'http://finance.sina.com.cn/realstock/company/' . $code . '/nc.shtml'; // 构建URL

$html = file_get_contents($url); // 获取HTML源码
$dom = new DOMDocument();
@$dom->loadHTML($html); // 解析HTML

$xpath = new DOMXPath($dom);
$name = $xpath->query('//h1[@class="name"]/text()')->item(0)->nodeValue; // 筛选股票名称
$price = $xpath->query('//span[@class="price"]/text()')->item(0)->nodeValue; // 筛选当前价格

echo $name . '的当前价格为' . $price;

Copier après la connexion

Test du programme

Avant d'exécuter le test, nous devons nous assurer que la bibliothèque de requêtes HTTP et les extensions associées ont été installées dans l'environnement PHP local. En prenant le système Windows comme exemple, vous pouvez l'installer avec la commande suivante :

composer require php-http/guzzle6-adapter
composer require php-http/message

Copier après la connexion

Ensuite, nous pouvons essayer d'obtenir les données boursières de l'indice composite de Shanghai (code boursier sh000001) :

$code = 'sh000001'; // 上证指数
$url = 'http://finance.sina.com.cn/realstock/company/' . $code . '/nc.shtml';

$client = new HttpAdapterGuzzle6Client();
$request = new HttpMessageRequest('GET', $url);
$response = $client->sendRequest($request);

$html = $response->getBody()->getContents();
$dom = new DOMDocument();
@$dom->loadHTML($html); // 解析HTML

$xpath = new DOMXPath($dom);
$name = $xpath->query('//h1[@class="name"]/text()')->item(0)->nodeValue;
$price = $xpath->query('//span[@class="price"]/text()')->item(0)->nodeValue;

echo $name . '的当前价格为' . $price;

Copier après la connexion

Après avoir exécuté le code, nous Vous pouvez voir le résultat de l'indice composite de Shanghai sur la console. Informations sur les prix actuels de l'indice.

Optimisation du programme

Le code ci-dessus n'est qu'un exemple simple. Dans les applications réelles, les facteurs suivants doivent être pris en compte pour l'optimisation :

Ajoutez une gestion des erreurs pour gérer la situation dans laquelle le code source HTML ne peut pas être obtenu en raison du réseau. ou d'autres raisons.
Peut être mis en cache au moment de l'accès récent pour éviter d'envoyer des requêtes HTTP à chaque fois que le programme est exécuté.
Vous pouvez surveiller plusieurs actions via une boucle infinie et déclencher automatiquement des notifications par e-mail lorsque le cours de l'action change.

En bref, l'écriture de programmes d'exploration de stocks doit prendre en compte de nombreux aspects tels que la sécurité, l'efficacité et la praticité, et doit être conçue et mise en œuvre pour obtenir les meilleurs résultats.

Référence

[Client HTTP PHP · php-http.org](http://docs.php-http.org/en/latest/)
[DOM HTML · w3school.com.cn](https: //www.w3school.com.cn/php/php_ref_dom.asp)
[XPath · zh.wikipedia.org](https://zh.wikipedia.org/wiki/XPath)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7493

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Guide d'installation et de mise à niveau de PHP 8.4 pour Ubuntu et Debian Dec 24, 2024 pm 04:42 PM

PHP 8.4 apporte plusieurs nouvelles fonctionnalités, améliorations de sécurité et de performances avec une bonne quantité de dépréciations et de suppressions de fonctionnalités. Ce guide explique comment installer PHP 8.4 ou mettre à niveau vers PHP 8.4 sur Ubuntu, Debian ou leurs dérivés. Bien qu'il soit possible de compiler PHP à partir des sources, son installation à partir d'un référentiel APT comme expliqué ci-dessous est souvent plus rapide et plus sécurisée car ces référentiels fourniront les dernières corrections de bogues et mises à jour de sécurité à l'avenir.

Discuter de CakePHP Sep 10, 2024 pm 05:28 PM

CakePHP est un framework open source pour PHP. Il vise à faciliter grandement le développement, le déploiement et la maintenance d'applications. CakePHP est basé sur une architecture de type MVC à la fois puissante et facile à appréhender. Modèles, vues et contrôleurs gu

Comment configurer Visual Studio Code (VS Code) pour le développement PHP Dec 20, 2024 am 11:31 AM

Visual Studio Code, également connu sous le nom de VS Code, est un éditeur de code source gratuit – ou environnement de développement intégré (IDE) – disponible pour tous les principaux systèmes d'exploitation. Avec une large collection d'extensions pour de nombreux langages de programmation, VS Code peut être c

Guide rapide CakePHP Sep 10, 2024 pm 05:27 PM

CakePHP est un framework MVC open source. Cela facilite grandement le développement, le déploiement et la maintenance des applications. CakePHP dispose d'un certain nombre de bibliothèques pour réduire la surcharge des tâches les plus courantes.

Comment analysez-vous et traitez-vous HTML / XML dans PHP? Feb 07, 2025 am 11:57 AM

Ce tutoriel montre comment traiter efficacement les documents XML à l'aide de PHP. XML (Language de balisage extensible) est un langage de balisage basé sur le texte polyvalent conçu à la fois pour la lisibilité humaine et l'analyse de la machine. Il est couramment utilisé pour le stockage de données et

Expliquez les jetons Web JSON (JWT) et leur cas d'utilisation dans les API PHP. Apr 05, 2025 am 12:04 AM

JWT est une norme ouverte basée sur JSON, utilisée pour transmettre en toute sécurité des informations entre les parties, principalement pour l'authentification de l'identité et l'échange d'informations. 1. JWT se compose de trois parties: en-tête, charge utile et signature. 2. Le principe de travail de JWT comprend trois étapes: la génération de JWT, la vérification de la charge utile JWT et l'analyse. 3. Lorsque vous utilisez JWT pour l'authentification en PHP, JWT peut être généré et vérifié, et les informations sur le rôle et l'autorisation des utilisateurs peuvent être incluses dans l'utilisation avancée. 4. Les erreurs courantes incluent une défaillance de vérification de signature, l'expiration des jetons et la charge utile surdimensionnée. Les compétences de débogage incluent l'utilisation des outils de débogage et de l'exploitation forestière. 5. L'optimisation des performances et les meilleures pratiques incluent l'utilisation des algorithmes de signature appropriés, la définition des périodes de validité raisonnablement,

Programme PHP pour compter les voyelles dans une chaîne Feb 07, 2025 pm 12:12 PM

Une chaîne est une séquence de caractères, y compris des lettres, des nombres et des symboles. Ce tutoriel apprendra à calculer le nombre de voyelles dans une chaîne donnée en PHP en utilisant différentes méthodes. Les voyelles en anglais sont a, e, i, o, u, et elles peuvent être en majuscules ou en minuscules. Qu'est-ce qu'une voyelle? Les voyelles sont des caractères alphabétiques qui représentent une prononciation spécifique. Il y a cinq voyelles en anglais, y compris les majuscules et les minuscules: a, e, i, o, u Exemple 1 Entrée: String = "TutorialSpoint" Sortie: 6 expliquer Les voyelles dans la chaîne "TutorialSpoint" sont u, o, i, a, o, i. Il y a 6 yuans au total

7 fonctions PHP que je regrette de ne pas connaître auparavant Nov 13, 2024 am 09:42 AM

Si vous êtes un développeur PHP expérimenté, vous aurez peut-être le sentiment d'y être déjà allé et de l'avoir déjà fait. Vous avez développé un nombre important d'applications, débogué des millions de lignes de code et peaufiné de nombreux scripts pour réaliser des opérations.

See all articles