Maison > développement back-end > tutoriel php > Exemples détaillés de développement de moteurs de recherche avec PHP+Sphinx+Mysql

Exemples détaillés de développement de moteurs de recherche avec PHP+Sphinx+Mysql

韦小宝
Libérer: 2023-03-20 07:32:01
original
6486 Les gens l'ont consulté

Tout le monde a l'impression qu'il est difficile d'écrire un moteur de recherche quand il l'entend. Il n'y a aucune idée. En fait, PHP peut également être utilisé pour le développement de moteurs de recherche, mais PHP doit être combiné avec sphinx et mysql pour le faire. développer le moteur de recherche que nous voulons. Je veux en savoir plus sur PHP Comment réaliser le développement d'un moteur de recherche ! Jetons un coup d'oeil ! !

Nous téléchargeons d'abord l'outil Sphinx, téléchargez l'adresse du site officiel, adresse de téléchargement : www.sphinxsearch.com, trouvez sphinx-2.2.10-release-win64.zip, téléchargez-le pour 64 bits, décompressez à nous Sous le répertoire d'exécution PHP, il est pratique de visualiser les résultats sur les pages Web suivantes.

introduction à Sphinx :

Sphinx est l'abréviation de SQL Phrase Index (expression de requête index ) Sphinx est un moteur de recherche en texte intégral basé sur SQL. il fournit notamment :PHP, Python, Perl, Ruby, java, etc. Dans le même temps, un plug-in de moteur SphinxSE est conçu pour MySQL, qui est un système distribué de récupération de texte intégral.
Avantages :
L'indexation haute vitesse peut atteindre 10 M/s
Recherche haute performance (données texte en 2-4G sur en moyenne, le temps de réponse moyen de récupération est inférieur à 0,1 seconde)
Peut gérer des quantités massives de données (actuellement connu pour être capable de traiter 100 Go de données texte et 100 millions de documents sur un seul système CPU )
Fournit un excellent algorithme de pertinence, une méthode de classement composite basée sur la similarité des phrases et des statistiques BM2
Prend en charge la recherche distribuée
Fournit la génération de fragments de documents fonction
Peut être utilisé comme moteur de stockage MySQL pour fournir des services de recherche
Prend en charge plusieurs modes de recherche tels que booléen, expression, similarité de mots, etc.
Inconvénients :
Doit avoir une clé primaire
La clé primaire doit être un entier
Non responsable des données stockage
La configuration n'est pas flexible

La structure du sphinx après décompression est telle que représentée sur la figure :


Voici notre processus. Pour la configuration associée, voir sphinx-min.conf.in dans l'image, copiez-le dans notre répertoire bin pour une utilisation facile et changez le nom en sphinx.conf,

modifiez le contenu à l'intérieur :

source src1
{
	type			= mysql

	sql_host		= localhost #主机地址
	sql_user		= root#帐号
	sql_pass		=     #密码
	sql_db			= sphinx  #数据库
	sql_port		= 3306	# 数据库端口 3306
	sql_query		= SELECT id, name, age FROM users #查询语句
	sql_attr_uint		= group_id
	sql_attr_timestamp	= date_added
	sql_query_pre = set names utf8   #数据库编码
}


index test1
{
	source			= src1
	path			= D:/myapaphe/www/sphinx/data #这个一定要配置
	charset_type = utf-8 #指定编码
	ngram_len = 1        #要找中文需指定为1.
	ngram_chars = U+3000..U+2FA1F
	
}

indexer
{
	mem_limit		= 128M
}
searchd
{
	listen			= 9312
	listen			= 9306:mysql41
	log			= D:\myapaphe\www\sphinx\log\searchd.log  #进程日志
	query_log		= D:\myapaphe\www\sphinx\log\query.log    #查询日志

	read_timeout		= 5
	max_children		= 30
	pid_file		= D:\myapaphe\www\sphinx\log\searchd.pid 
	seamless_rotate		= 1
	preopen_indexes		= 1
	unlink_old		= 1
	workers			= threads # for RT to work
	binlog_path		= D:\myapaphe\www\sphinx\data
}
Copier après la connexion

Ce qui précède doit être configuré et le chemin doit correspondre à votre propre chemin.

Générez ensuite l'index de requête :


Installez le service searchd :


Chargez ensuite le fichier de configuration :


Démarrez le service :


OK, le travail de configuration précédent et le démarrage du service sont terminés. Démarrez maintenant le code :

Créez test3.php dans le dossier api sous sphinx et exécutez test3.php<. 🎜>

<?php 
require ( "sphinxapi.php" );
$s = new SphinxClient();
$s->SetServer(&#39;localhost&#39;,9312);
$result = $s->Query(&#39;高七&#39;);
echo &#39;<pre class="brush:php;toolbar:false">&#39;;
print_r($result);
Copier après la connexion


Le code tronqué est dû au fait que cmd est par défaut l'encodage gbk. Nous l'avons mis dans le navigateur pour afficher :

<.>


Nous voyons que ce que le sphinx a trouvé n'était pas le résultat complet mais nous a renvoyé l'identifiant, nous permettant de vérifier les données en fonction du IDENTIFIANT.

La comparaison du temps de requête est la suivante :


Le temps que j'ai testé sur plus de 40 000 données était de 0,001 s. regarde mysql Combien de temps prend la requête :


On voit que cela prend 0,04s, il n'y a pas beaucoup de données, et le résultat n'est pas si évident, mais l'écart de 0,039s n'est pas petit.

Cela termine l'intégration de sphinx. J'espère que cela pourra aider tout le monde.

Recommandations associées :

php Explication détaillée de l'appel des moteurs de recherche existants

code de fonction php pour déterminer si le visiteur est un robot de moteur de recherche

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal