搜索引擎大致由搜索系统、索引系统、检索系统三个部分组成。所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。
搜索引擎的工作过程,一般分为五个步骤:
(1)从互联网上抓取网页,利用能够从互联网上自动收集网页的网络蜘蛛程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
(2)由网页分析程序对收集回来的网页进行分析,提取相关网页信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度。
(3)然后用这些相关信息建立网页索引数据库。
(4)用户通过查询接口输入查询条件,检索程序在索引数据库中检索,从网页索引数据库中找到符合该关键词的所有相关网页。
(5)页面生成系统将搜索结果的链接地址和摘要等内容组织起来返回给用户。
Atas ialah kandungan terperinci 搜索引擎大致由哪三个部分组成. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!