php analysis如何提取關鍵字? (代碼)
本篇文章帶給大家的內容是關於php analysis如何提取關鍵字? (程式碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。
最近在開發一個文章模組功能,設計那邊提出要給文章生成對應標籤,用於文章關聯推送,這裡和大家分享一下實現過程;
這裡需要用到PHPAnalysis,下載連結如下
連結:https://pan.baidu.com/s/1GBbAn-LGcNeOgeV62XSUeg
提取碼:xzmx
提取關鍵字方法如下:
<?php/** * 关键字提取方法 * * @param $title string * 进行分词的标题 * @param $content string * 进行分词的内容 * @return array 得到的关键词数组 */ function getKeywords($title = "", $content = "") { if (empty ( $title )) { return array (); } if (empty ( $content )) { return array (); } $data = $title . $title . $title . $content; // 为了增加title的权重,这里连接3次 //这个地方写上phpanalysis对应放置路径 require_once './phpanalysis/phpanalysis.class.php'; PhpAnalysis::$loadInit = false; //初始化类时是否直接加载词典,选是载入速度较慢,但解析较快;选否载入较快,但解析较慢 $pa = new PhpAnalysis ( 'utf-8', 'utf-8', false ); $pa->LoadDict (); //载入词典 $pa->SetSource ( $data ); //设置源字符串 $pa->StartAnalysis ( true ); //是否对结果进行优化 $tags = $pa->GetFinallyKeywords (4); // 获取文章中的五个关键字 $tagsArr = explode (",",$tags); return $tagsArr;//返回关键字数组 }
下面模擬一組資料驗證一下其可行性和準確度;
$title = "最前线丨科技股领跌美股大盘,是否预示着下一轮的经济风暴?"; $content = " 科技股加速下跌,“危机”或许刚刚开始。 周三,美国股市遭遇重挫,纳指收盘大跌逾4%,道指跌超800点。截止收盘,纳斯达克指数大跌4.08%,报7422.05点,创7月3日以来最低,标普500指数下跌3.29%,创2月以来最大跌幅,道琼斯指数下跌3.15%,报25598.74点,创8月16日以来最低。 美股年内表现最好的科技股也普遍跳水,亚马逊跌超6%,单日市值蒸发超500亿美元,苹果、谷歌、Facebook均跌逾4%,奈飞跌超8%。中概股也未能幸免,京东、百度均跌超3%,流利说收跌14.99%,拼多多收跌9%,阿里巴巴收跌5.89%,在最近5个交易日中,阿里巴巴累计跌掉了15%,已经创下2014年纽约上市以来最大5天跌幅。 这轮暴跌早有信号,此前三天内,美股“恐慌指数”VIX大幅增长至58%,隔夜大涨近28%。一般而言,股市上涨时VIX指数倾向于下跌。而市场利空消息或许是美股隔夜巨震的重要原因。 9月26日美联储货币政策公布,决定今年第三次加息25个基点。美联储主席鲍威尔一周内两度公开表态渐进式加息,他认为美国经济表现“相当正面”,没有理由不认为当前的经济扩张“可以延续相当一段时间”。 一边是美联储坚定的加息立场,一边是特朗普的连番指责。周三美股收盘后,特朗普指责美联储“已经疯了”,表示不同意联储现在的行动,等待矫正,并期待已久。 本月9日,国际货币基金组织(IMF)发布最新一期《世界经济展望》报告,下调今明两年世界经济增速至3.7%,这低于7月预测的3.9%。IMF还将2019年美国经济预期增长率由2.7%下调至2.5%,原因之一是美国加征关税措施正在逐步落实,导致全球的贸易摩擦不断升级,《报告》就此发出警告并呼吁各经济体系共同努力,维护世界经济增长。 这一系列的举措和警示已经落实在美国股市,美股在周三大跌之前已经出现疲软,进入9月就有微跌,这次的大跌让美股短期内不被看好板上钉钉。而对于科技股首当其冲领跌大盘的原因,还得结合市场环境和企业自身来看。 今年以来科技巨头在美股市场表现强劲,Netflix涨幅达70%左右,亚马逊股价累计上涨50%,苹果也攀升了近30%。“科技股在2018年迄今已获得巨大涨幅,这意味着其价格有点稍贵,因此很自然会出现回调。此外,科技股都是些面临大量国际风险敞口的跨国公司股票。他们的很大一部分利润来自海外市场,很容易受到国际贸易形势的影响。”E-Trade Financial公司高级副总裁Chris Larkin在上个月就做出预测。 而连日来,部分科技股各自也是烦恼不断,苹果iPhone XS销量不如预期,谷歌母公司盈利不佳,亚马逊将员工最低时薪提升至15美元,塞德勒给客户的研报中称这一举动会给亚马逊第四季度新增3.1亿美元的成本。 股价回调、国际贸易摩擦、企业发展现状及战略等因素致使科技股被同步抛售。以目前美股释放出的信号来看,科技股在大跌中进入了回调期,自然免不了要经历一段暗黑时光,陪跑的还有全球股市。 从数据来看,欧洲三大股指已经集体大跌,英国富时100指数收跌1.27%,法国CAC40指数跌2.11%,德国DAX指数跌2.21%。亚太市场受到强力波及,今日开盘均大跌,日经225指数跌3.1%,跌破22800关口,韩国首尔综指开盘跌2.35%,A股市场大幅低开,沪指盘中跌破“熔断底”,香港恒生指数低开3.1%,下破26000点,创15个月新低。 苏宁金融研究院特约研究员江瀚表示,美国的十年大牛市可能已经处于强弩之末,在这样的情况下,一旦美国股市出现大规模问题,必然会引发其他地区股市的病毒式爆发,这将会引发全球市场的担忧。"; echo "<pre class="brush:php;toolbar:false">"; var_dump(getKeywords($title,$content));die;
上面內容擷取出來的五個關鍵字如下:
# 個人認為提取出來的這五個關鍵字和文章內容是非常的相符的;
以上就是本篇文章的全部內容了,關於php的更多精彩可以追蹤PHP中文網的php圖文教學欄位! ! !
以上是php analysis如何提取關鍵字? (代碼)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

JWT是一種基於JSON的開放標準,用於在各方之間安全地傳輸信息,主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時,可以生成和驗證JWT,並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大,調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

會話劫持可以通過以下步驟實現:1.獲取會話ID,2.使用會話ID,3.保持會話活躍。在PHP中防範會話劫持的方法包括:1.使用session_regenerate_id()函數重新生成會話ID,2.通過數據庫存儲會話數據,3.確保所有會話數據通過HTTPS傳輸。

RESTAPI設計原則包括資源定義、URI設計、HTTP方法使用、狀態碼使用、版本控制和HATEOAS。 1.資源應使用名詞表示並保持層次結構。 2.HTTP方法應符合其語義,如GET用於獲取資源。 3.狀態碼應正確使用,如404表示資源不存在。 4.版本控制可通過URI或頭部實現。 5.HATEOAS通過響應中的鏈接引導客戶端操作。

在PHP中,異常處理通過try,catch,finally,和throw關鍵字實現。 1)try塊包圍可能拋出異常的代碼;2)catch塊處理異常;3)finally塊確保代碼始終執行;4)throw用於手動拋出異常。這些機制幫助提升代碼的健壯性和可維護性。

匿名類在PHP中的主要作用是創建一次性使用的對象。 1.匿名類允許在代碼中直接定義沒有名字的類,適用於臨時需求。 2.它們可以繼承類或實現接口,增加靈活性。 3.使用時需注意性能和代碼可讀性,避免重複定義相同的匿名類。

在PHP中,include,require,include_once,require_once的區別在於:1)include產生警告並繼續執行,2)require產生致命錯誤並停止執行,3)include_once和require_once防止重複包含。這些函數的選擇取決於文件的重要性和是否需要防止重複包含,合理使用可以提高代碼的可讀性和可維護性。

PHP中有四種主要錯誤類型:1.Notice:最輕微,不會中斷程序,如訪問未定義變量;2.Warning:比Notice嚴重,不會終止程序,如包含不存在文件;3.FatalError:最嚴重,會終止程序,如調用不存在函數;4.ParseError:語法錯誤,會阻止程序執行,如忘記添加結束標籤。

PHP和Python各有優勢,選擇依據項目需求。 1.PHP適合web開發,尤其快速開發和維護網站。 2.Python適用於數據科學、機器學習和人工智能,語法簡潔,適合初學者。
