手把手教你做关键词匹配项目(搜索引擎)---- 第二十二天,教你做第二十二天_PHP教程
手把手教你做关键词匹配项目(搜索引擎)---- 第二十二天,教你做第二十二天
最新面试经历:面试的感触(二)、面试的感触
最新的架构:高并发数据采集的架构应用(Redis的应用)
吐槽:今天也是刚把心态调整好,继续写以前没有完成的文章,最近几个月自己也是休整了一段时间,回家做苦力,也当作是锻炼锻炼自己的身体,毕竟任何东西都换不回你的健康,我也是建议做IT行业的帅哥们多活动活动你们其它的部位。
第二十二天
起点:手把手教你做关键词匹配项目(搜索引擎)---- 第一天
回顾:手把手教你做关键词匹配项目(搜索引擎)---- 第二十一天
小帅帅是乐于做总结的人,根据以前所学的知识他总结了如下:
1. 宝贝属性的扩展和类型的问题初步已经得到很好的控制了,不过要推广和运营维护还是遇到了很大的障碍。
2. 对关键词的拆分使用了scws扩展以及自己原生的业务拆词方案,拆词有效的解决了词组方面的匹配难度。
3. 所有的初始工作好像已经完成了,只需要最后的整理项目应该可以正式运行起来了。
小帅帅的主动意识比较强烈,他没有去问于老大,就自己动手写了份代码,该代码主要是为了把所有的步骤连接起来。
宝贝属性的扩展CharList的构建请参照:手把手教你做关键词匹配项目(搜索引擎)---- 第十二天 ~ 手把手教你做关键词匹配项目(搜索引擎)---- 第十八天
Selector主要步骤如下:
1. 获取宝贝属性。
2. 使用业务知识扩充宝贝属性,形成CharList
3. 从词库中获取关键词
4. 关键词拆分算法
5. 匹配度算法
6. 返回匹配上的关键词列表
代码如下:
<span> 1</span> <?<span>php </span><span> 2</span> <span>#</span><span>@Filename:selector/Selector.php</span> <span> 3</span> <span>#</span><span>@Author:oshine</span> <span> 4</span> <span> 5</span> <span>require_once</span> <span>dirname</span>(<span>__FILE__</span>) . '/SelectorItem.php'<span>; </span><span> 6</span> <span>require_once</span> <span>dirname</span>(<span>__FILE__</span>) . '/charlist/CharList.php'<span>; </span><span> 7</span> <span>require_once</span> <span>dirname</span>(<span>__FILE__</span>) . '/charlist/CharlistHandle.php'<span>; </span><span> 8</span> <span>require_once</span> <span>dirname</span>(<span>dirname</span>(<span>__FILE__</span>)) . '/lib/Logger.php'<span>; </span><span> 9</span> <span>10</span> <span>class</span><span> Selector </span><span>11</span> <span>{ </span><span>12</span> <span>13</span> <span>private</span> <span>static</span> <span>$charListHandle</span> = <span>array</span><span>( </span><span>14</span> "黑名单" => "BacklistCharListHandle", <span>15</span> "近义词" => "LinklistCharListHandle" <span>16</span> <span> ); </span><span>17</span> <span>18</span> <span>public</span> <span>static</span> <span>function</span> select(<span>$num_iid</span><span>) </span><span>19</span> <span> { </span><span>20</span> <span>$selectorItem</span> = SelectorItem::createFromApi(<span>$num_iid</span><span>); </span><span>21</span> <span>22</span> Logger::trace(<span>$selectorItem</span>-><span>props_name); </span><span>23</span> <span>24</span> <span>$charlist</span> = <span>new</span><span> CharList(); </span><span>25</span> <span>26</span> <span>foreach</span> (self::<span>$charListHandle</span> <span>as</span> <span>$matchKey</span> => <span>$className</span><span>) { </span><span>27</span> <span>28</span> <span>$handle</span> = self::createCharListHandle(<span>$className</span>, <span>$charlist</span>, <span>$selectorItem</span><span>); </span><span>29</span> <span>$handle</span>-><span>exec</span><span>(); </span><span>30</span> <span>31</span> <span> } </span><span>32</span> <span>33</span> <span>$selectWords</span> = <span>array</span><span>(); </span><span>34</span> <span>35</span> <span>$keywords</span> = DB::makeArray("select word from keywords"<span>); </span><span>36</span> <span>foreach</span> (<span>$keywords</span> <span>as</span> <span>$val</span><span>) { </span><span>37</span> <span>#</span><span> code...</span> <span>38</span> <span>$keywordEntity</span> = SplitterApp::<span>split</span>(<span>$val</span>["word"<span>]); </span><span>39</span> <span>40</span> <span>#</span><span> code...</span> <span>41</span> <span>if</span>(MacthExector::macth(<span>$keywordEntity</span>,<span>$charlist</span><span>)){ </span><span>42</span> <span>$selectWords</span>[] = <span>$val</span>["word"<span>]; </span><span>43</span> <span> } </span><span>44</span> <span>45</span> <span> } </span><span>46</span> <span>47</span> <span>return</span> <span>$selectWords</span><span>; </span><span>48</span> <span> } </span><span>49</span> <span>50</span> <span>public</span> <span>static</span> <span>function</span> createCharListHandle(<span>$className</span>, <span>$charlist</span>, <span>$selectorItem</span><span>) </span><span>51</span> <span> { </span><span>52</span> <span>if</span> (<span>class_exists</span>(<span>$className</span><span>)) { </span><span>53</span> <span>return</span> <span>new</span> <span>$className</span>(<span>$charlist</span>, <span>$selectorItem</span><span>); </span><span>54</span> <span> } </span><span>55</span> <span>throw</span> <span>new</span> <span>Exception</span>("class not exists", 0<span>); </span><span>56</span> <span> } </span><span>57</span> }
测试驱动代码编程请参照:
也是使用一样的原理,先把测试代码写好,后续补全MatchExector代码。
MatchExector主要功能计算匹配度。
1. 如果只要有一个词在黑名单里面,匹配度肯定为零。
2. 如果是核心词,那么根据以前提到的算法来计算,请参照:手把手教你做关键词匹配项目(搜索引擎)---- 第十九天
<span> 1</span> <?<span>php </span><span> 2</span> <span>#</span><span>@Filename:mathes/MatchExector.php</span> <span> 3</span> <span>#</span><span>@Author:oshine</span> <span> 4</span> <span> 5</span> <span>class</span><span> MatchExector { </span><span> 6</span> <span> 7</span> <span>public</span> <span>static</span> <span>function</span> match(KeywordEntity <span>$keywordEntity</span>,CharList <span>$charlist</span><span>){ </span><span> 8</span> <span> 9</span> <span>$matchingDegree</span> = 0<span>; </span><span>10</span> <span>$elementWords</span> = <span>$keywordEntity</span>-><span>getElementWords(); </span><span>11</span> <span>foreach</span> (<span>$elementWords</span> <span>as</span> <span>$word</span><span>) { </span><span>12</span> <span>#</span><span> code...</span> <span>13</span> <span>if</span>(<span>in_array</span>(<span>$word</span>, <span>$charlist</span>-><span>getBlacklist())) </span><span>14</span> <span>return</span> <span>false</span><span>; </span><span>15</span> <span>if</span>(<span>in_array</span>(<span>$word</span>, <span>$charlist</span>-><span>getCore())) </span><span>16</span> <span>$matchingDegree</span>+=<span>$keywordEntity</span>->calculateWeight(<span>$word</span><span>); </span><span>17</span> <span>18</span> <span> } </span><span>19</span> <span>20</span> <span>if</span>(<span>$matchingDegree</span>>0.8<span>) </span><span>21</span> <span>return</span> <span>true</span><span>; </span><span>22</span> <span>return</span> <span>false</span><span>; </span><span>23</span> <span>24</span> <span> } </span><span>25</span> <span>26</span> }
整个代码相对来说实现了该有的功能,小帅帅非常的高兴,因为项目完成了肯定少不了项目奖金,说不定还有一餐丰富的晚餐,
想想都开始流口水了。
小帅帅把代码交给于老大,满怀期待的等候于老大的最后肯定。
于老大看了之后会有哪些反应呢?请关注第三章:关键词匹配项目深入研究(一)
第二章已完结,源代码地址:手把手教你做关键词匹配项目(二章完结篇)

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

光圈大小的調整對於拍照效果有著至關重要的影響,小米14Ultra在相機光圈調整方面提供了前所未有的靈活性。為了讓大家都能順利調節光圈,實現光圈大小的自由調節,小編在這裡為大家帶來了小米14Ultra怎麼設定光圈的詳細教學。小米14Ultra怎麼調整光圈?啟動相機,切換至“專業模式”,選擇主鏡頭-W鏡頭。點選光圈,開啟光圈轉盤,A為自動,按需選擇f/1.9或f/4.0。

費馬大定理,即將被AI攻克?而整件事最有意義的地方在於,AI即將解決的費馬大定理,正是為了證明AI無用。曾經,數學屬於純粹的人類智力王國;如今,這片疆土正被先進的演算法所破解,所踐踏。圖片費馬大定理,是一個「臭名昭著」的謎題,在幾個世紀以來,一直困擾著數學家。它在1993年被證明,而現在,數學家們有一個偉大計畫:用電腦把證明過程重現。他們希望在這個版本的證明中,如果有任何邏輯上的錯誤,都可以由電腦檢查出來。專案網址:https://github.com/riccardobrasca/flt

Ce修改器(CheatEngine)是一款專用於對遊戲內存進行修改和編輯的遊戲修改工具,那麼在CheatEngine中怎麼設置中文呢?接下來小編為大夥講述ce修改器設置中文的方法內容,希望可以幫助到有需要的朋友。在我們下載的新軟體中,若發現它不是中文介面,可能會讓人感到困惑。儘管這款軟體不是由中國開發的,但我們仍有方法將其轉換為中文版本。只要簡單地套用中文補丁,就能解決這個問題。在下載並安裝了CheatEngine(ce修改器)軟體後,開啟安裝位置,找到名為languages的資料夾,如下圖所示

榮耀90GT是一款性價比很高的智慧型手機,擁有出色的效能和出色的使用者體驗。然而,有時候我們可能會遇到一些問題,例如榮耀90GT怎麼更新榮耀MagicOS8.0呢?這個步驟因為不同的手機不同的機型可能會有些差別,那麼,讓我們一起來探討一下,如何正確地升級系統。榮耀90GT怎麼更新榮耀MagicOS8.0?2月28日訊息,榮耀今天為旗下90GT/100/100Pro三款手機推送MagicOS8.0公測更新,包版本號為8.0.0.106(C00E106R3P1)1.確保您的榮耀90GT的電池電量充足,

Apple在周二推出了iOS17.4更新,為iPhone帶來了一系列新功能和修復。這次更新包含了全新的表情符號,同時歐盟用戶也能夠下載其他應用程式商店。此外,更新還加強了對iPhone安全性的控制,引入了更多的「失竊設備保護」設定選項,為用戶提供更多選擇和保障。 "iOS17.3首次引入了「失竊設備保護」功能,為用戶的敏感資料增加了額外的安全保障。當用戶不在家等熟悉地點時,該功能要求用戶首次輸入生物特徵信息,並在一小時後再次輸入資訊才能存取和更改某些數據,如修改AppleID密碼或關閉失竊設備保護功能

成立於上個加密週期的熱門元宇宙遊戲項目們正在加速擴張。 3月4日,Web3遊戲元宇宙平台PlanetMojo宣布了其遊戲生態的多個重要動態,包括預告即將推出跑酷遊戲GoGoMojo、旗艦自走棋遊戲MojoMelee推出新賽季“戰之道”,以及為慶祝新賽季與MagicEden合作推出的首個ETH系列「WarBannerNFT」。另外,PlanetMojo也透露,他們計劃在今年稍後推出MojoMelee的Android和iOS行動版本。這個計畫在2021年底啟動,經過在熊市中近兩年的努力建設,即將在

最近新消息,lackMagic目前推出了達文西DaVinciResolveStudio影片編輯軟體的18.5PublicBeta2公測版更新,為AMDRadeon顯示卡帶來了AV1編碼支援。更新到最新版本後,AMD顯示卡用戶將能夠在DaVinciResolveStudio中利用硬體加速來進行AV1編碼。儘管官方並未具體指明支援的架構或型號,但預計所有的AMD顯示卡用戶都可以嘗試這項功能。 2018年,AOMedia發布了全新的視訊編碼標準AV1(AOMediaVideoCodec1.0)。 AV1是由多家

答案:是,Golang提供的函數可以簡化檔案上傳處理。詳情:MultipartFile類型提供對文件元資料和內容的存取。 FormFile函數從表單請求中取得特定檔案。 ParseForm和ParseMultipartForm函數用於解析表單資料和多部分錶單資料。使用這些函數簡化了文件處理流程,讓開發者專注於業務邏輯。
