Tout le monde a l'impression qu'il est difficile d'écrire un moteur de recherche quand il l'entend. Il n'y a aucune idée. En fait, PHP peut également être utilisé pour le développement de moteurs de recherche, mais PHP doit être combiné avec sphinx et mysql pour le faire. développer le moteur de recherche que nous voulons. Je veux en savoir plus sur PHP Comment réaliser le développement d'un moteur de recherche ! Jetons un coup d'oeil ! !
Nous téléchargeons d'abord l'outil Sphinx, téléchargez l'adresse du site officiel, adresse de téléchargement : www.sphinxsearch.com, trouvez sphinx-2.2.10-release-win64.zip, téléchargez-le pour 64 bits, décompressez à nous Sous le répertoire d'exécution PHP, il est pratique de visualiser les résultats sur les pages Web suivantes.
introduction à Sphinx :
Sphinx est l'abréviation de SQL Phrase Index (expression de requête index ) Sphinx est un moteur de recherche en texte intégral basé sur SQL. il fournit notamment :PHP, Python, Perl, Ruby, java, etc. Dans le même temps, un plug-in de moteur SphinxSE est conçu pour MySQL, qui est un système distribué de récupération de texte intégral.
Avantages :
L'indexation haute vitesse peut atteindre 10 M/s
Recherche haute performance (données texte en 2-4G sur en moyenne, le temps de réponse moyen de récupération est inférieur à 0,1 seconde)
Peut gérer des quantités massives de données (actuellement connu pour être capable de traiter 100 Go de données texte et 100 millions de documents sur un seul système CPU )
Fournit un excellent algorithme de pertinence, une méthode de classement composite basée sur la similarité des phrases et des statistiques BM2
Prend en charge la recherche distribuée
Fournit la génération de fragments de documents fonction
Peut être utilisé comme moteur de stockage MySQL pour fournir des services de recherche
Prend en charge plusieurs modes de recherche tels que booléen, expression, similarité de mots, etc.
Inconvénients :
Doit avoir une clé primaire
La clé primaire doit être un entier
Non responsable des données stockage
La configuration n'est pas flexible
La structure du sphinx après décompression est telle que représentée sur la figure :
Voici notre processus. Pour la configuration associée, voir sphinx-min.conf.in dans l'image, copiez-le dans notre répertoire bin pour une utilisation facile et changez le nom en sphinx.conf,
modifiez le contenu à l'intérieur :
source src1 { type = mysql sql_host = localhost #主机地址 sql_user = root#帐号 sql_pass = #密码 sql_db = sphinx #数据库 sql_port = 3306 # 数据库端口 3306 sql_query = SELECT id, name, age FROM users #查询语句 sql_attr_uint = group_id sql_attr_timestamp = date_added sql_query_pre = set names utf8 #数据库编码 } index test1 { source = src1 path = D:/myapaphe/www/sphinx/data #这个一定要配置 charset_type = utf-8 #指定编码 ngram_len = 1 #要找中文需指定为1. ngram_chars = U+3000..U+2FA1F } indexer { mem_limit = 128M } searchd { listen = 9312 listen = 9306:mysql41 log = D:\myapaphe\www\sphinx\log\searchd.log #进程日志 query_log = D:\myapaphe\www\sphinx\log\query.log #查询日志 read_timeout = 5 max_children = 30 pid_file = D:\myapaphe\www\sphinx\log\searchd.pid seamless_rotate = 1 preopen_indexes = 1 unlink_old = 1 workers = threads # for RT to work binlog_path = D:\myapaphe\www\sphinx\data }
Ce qui précède doit être configuré et le chemin doit correspondre à votre propre chemin.
Générez ensuite l'index de requête :
Installez le service searchd :
Chargez ensuite le fichier de configuration :
Démarrez le service :
OK, le travail de configuration précédent et le démarrage du service sont terminés. Démarrez maintenant le code :
Créez test3.php dans le dossier api sous sphinx et exécutez test3.php<. 🎜>
<?php require ( "sphinxapi.php" ); $s = new SphinxClient(); $s->SetServer('localhost',9312); $result = $s->Query('高七'); echo '<pre class="brush:php;toolbar:false">'; print_r($result);
Nous voyons que ce que le sphinx a trouvé n'était pas le résultat complet mais nous a renvoyé l'identifiant, nous permettant de vérifier les données en fonction du IDENTIFIANT.
La comparaison du temps de requête est la suivante :
Le temps que j'ai testé sur plus de 40 000 données était de 0,001 s. regarde mysql Combien de temps prend la requête :
On voit que cela prend 0,04s, il n'y a pas beaucoup de données, et le résultat n'est pas si évident, mais l'écart de 0,039s n'est pas petit.
Cela termine l'intégration de sphinx. J'espère que cela pourra aider tout le monde.
Recommandations associées :
php Explication détaillée de l'appel des moteurs de recherche existants
code de fonction php pour déterminer si le visiteur est un robot de moteur de recherche
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!