搜尋引擎大致由搜尋系統、索引系統、檢索系統三個部分組成。所謂搜尋引擎,就是根據使用者需求與某一演算法,運用特定策略從網路擷取制定資訊回饋給使用者的檢索技術。
搜尋引擎的工作過程,一般分為五個步驟:
(1)從網路上抓取網頁,利用能夠從網路上自動收集網頁的網路蜘蛛程序,自動訪問互聯網,並沿著任何網頁中的所有URL爬到其它網頁,重複這過程,並把爬過的所有網頁收集回來。
(2)由網頁分析程式對收集回來的網頁進行分析,提取相關網頁信息,根據一定的相關度算法進行大量複雜計算,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵字的相關度。
(3)接著用這些相關資訊建立網頁索引資料庫。
(4)使用者透過查詢介面輸入查詢條件,檢索程式在索引資料庫中檢索,從網頁索引資料庫中找到符合該關鍵字的所有相關網頁。
(5)頁面產生系統將搜尋結果的連結位址和摘要等內容組織起來回傳給使用者。
以上是搜尋引擎大致由哪三個部分組成的詳細內容。更多資訊請關注PHP中文網其他相關文章!