首頁 後端開發 php教程 php analysis如何提取關鍵字? (代碼)

php analysis如何提取關鍵字? (代碼)

Oct 12, 2018 pm 02:55 PM

本篇文章帶給大家的內容是關於php analysis如何提取關鍵字? (程式碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。

最近在開發一個文章模組功能,設計那邊提出要給文章生成對應標籤,用於文章關聯推送,這裡和大家分享一下實現過程;

這裡需要用到PHPAnalysis,下載連結如下

連結:https://pan.baidu.com/s/1GBbAn-LGcNeOgeV62XSUeg
提取碼:xzmx

提取關鍵字方法如下:

<?php/** 
 * 关键字提取方法 
 * 
 * @param $title string 
 *         进行分词的标题 
 * @param $content string 
 *         进行分词的内容 
 * @return array 得到的关键词数组 
 */  function getKeywords($title = "", $content = "") {  
    if (empty ( $title )) {  
        return array ();  
    }  
    if (empty ( $content )) {  
        return array ();  
    }  
    $data = $title . $title . $title . $content; // 为了增加title的权重,这里连接3次  
       
    //这个地方写上phpanalysis对应放置路径  
    require_once &#39;./phpanalysis/phpanalysis.class.php&#39;;  
       
    PhpAnalysis::$loadInit = false;  //初始化类时是否直接加载词典,选是载入速度较慢,但解析较快;选否载入较快,但解析较慢
    $pa = new PhpAnalysis ( &#39;utf-8&#39;, &#39;utf-8&#39;, false );  

    $pa->LoadDict ();  //载入词典
    $pa->SetSource ( $data );  //设置源字符串
    $pa->StartAnalysis ( true );  //是否对结果进行优化
       
    $tags = $pa->GetFinallyKeywords (4); // 获取文章中的五个关键字  
   
    $tagsArr = explode (",",$tags);  
    return $tagsArr;//返回关键字数组  }
登入後複製

下面模擬一組資料驗證一下其可行性和準確度;

$title = "最前线丨科技股领跌美股大盘,是否预示着下一轮的经济风暴?";
$content = " 科技股加速下跌,“危机”或许刚刚开始。

周三,美国股市遭遇重挫,纳指收盘大跌逾4%,道指跌超800点。截止收盘,纳斯达克指数大跌4.08%,报7422.05点,创7月3日以来最低,标普500指数下跌3.29%,创2月以来最大跌幅,道琼斯指数下跌3.15%,报25598.74点,创8月16日以来最低。

美股年内表现最好的科技股也普遍跳水,亚马逊跌超6%,单日市值蒸发超500亿美元,苹果、谷歌、Facebook均跌逾4%,奈飞跌超8%。中概股也未能幸免,京东、百度均跌超3%,流利说收跌14.99%,拼多多收跌9%,阿里巴巴收跌5.89%,在最近5个交易日中,阿里巴巴累计跌掉了15%,已经创下2014年纽约上市以来最大5天跌幅。

这轮暴跌早有信号,此前三天内,美股“恐慌指数”VIX大幅增长至58%,隔夜大涨近28%。一般而言,股市上涨时VIX指数倾向于下跌。而市场利空消息或许是美股隔夜巨震的重要原因。

9月26日美联储货币政策公布,决定今年第三次加息25个基点。美联储主席鲍威尔一周内两度公开表态渐进式加息,他认为美国经济表现“相当正面”,没有理由不认为当前的经济扩张“可以延续相当一段时间”。

一边是美联储坚定的加息立场,一边是特朗普的连番指责。周三美股收盘后,特朗普指责美联储“已经疯了”,表示不同意联储现在的行动,等待矫正,并期待已久。

本月9日,国际货币基金组织(IMF)发布最新一期《世界经济展望》报告,下调今明两年世界经济增速至3.7%,这低于7月预测的3.9%。IMF还将2019年美国经济预期增长率由2.7%下调至2.5%,原因之一是美国加征关税措施正在逐步落实,导致全球的贸易摩擦不断升级,《报告》就此发出警告并呼吁各经济体系共同努力,维护世界经济增长。

这一系列的举措和警示已经落实在美国股市,美股在周三大跌之前已经出现疲软,进入9月就有微跌,这次的大跌让美股短期内不被看好板上钉钉。而对于科技股首当其冲领跌大盘的原因,还得结合市场环境和企业自身来看。

今年以来科技巨头在美股市场表现强劲,Netflix涨幅达70%左右,亚马逊股价累计上涨50%,苹果也攀升了近30%。“科技股在2018年迄今已获得巨大涨幅,这意味着其价格有点稍贵,因此很自然会出现回调。此外,科技股都是些面临大量国际风险敞口的跨国公司股票。他们的很大一部分利润来自海外市场,很容易受到国际贸易形势的影响。”E-Trade Financial公司高级副总裁Chris Larkin在上个月就做出预测。

而连日来,部分科技股各自也是烦恼不断,苹果iPhone XS销量不如预期,谷歌母公司盈利不佳,亚马逊将员工最低时薪提升至15美元,塞德勒给客户的研报中称这一举动会给亚马逊第四季度新增3.1亿美元的成本。

股价回调、国际贸易摩擦、企业发展现状及战略等因素致使科技股被同步抛售。以目前美股释放出的信号来看,科技股在大跌中进入了回调期,自然免不了要经历一段暗黑时光,陪跑的还有全球股市。

从数据来看,欧洲三大股指已经集体大跌,英国富时100指数收跌1.27%,法国CAC40指数跌2.11%,德国DAX指数跌2.21%。亚太市场受到强力波及,今日开盘均大跌,日经225指数跌3.1%,跌破22800关口,韩国首尔综指开盘跌2.35%,A股市场大幅低开,沪指盘中跌破“熔断底”,香港恒生指数低开3.1%,下破26000点,创15个月新低。


苏宁金融研究院特约研究员江瀚表示,美国的十年大牛市可能已经处于强弩之末,在这样的情况下,一旦美国股市出现大规模问题,必然会引发其他地区股市的病毒式爆发,这将会引发全球市场的担忧。";
echo "<pre class="brush:php;toolbar:false">";
var_dump(getKeywords($title,$content));die;
登入後複製

上面內容擷取出來的五個關鍵字如下:

# 個人認為提取出來的這五個關鍵字和文章內容是非常的相符的;

以上就是本篇文章的全部內容了,關於php的更多精彩可以追蹤PHP中文網的php圖文教學欄位! ! !

以上是php analysis如何提取關鍵字? (代碼)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1653
14
CakePHP 教程
1413
52
Laravel 教程
1306
25
PHP教程
1251
29
C# 教程
1224
24
在PHP API中說明JSON Web令牌(JWT)及其用例。 在PHP API中說明JSON Web令牌(JWT)及其用例。 Apr 05, 2025 am 12:04 AM

JWT是一種基於JSON的開放標準,用於在各方之間安全地傳輸信息,主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時,可以生成和驗證JWT,並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大,調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

會話如何劫持工作,如何在PHP中減輕它? 會話如何劫持工作,如何在PHP中減輕它? Apr 06, 2025 am 12:02 AM

會話劫持可以通過以下步驟實現:1.獲取會話ID,2.使用會話ID,3.保持會話活躍。在PHP中防範會話劫持的方法包括:1.使用session_regenerate_id()函數重新生成會話ID,2.通過數據庫存儲會話數據,3.確保所有會話數據通過HTTPS傳輸。

什麼是REST API設計原理? 什麼是REST API設計原理? Apr 04, 2025 am 12:01 AM

RESTAPI設計原則包括資源定義、URI設計、HTTP方法使用、狀態碼使用、版本控制和HATEOAS。 1.資源應使用名詞表示並保持層次結構。 2.HTTP方法應符合其語義,如GET用於獲取資源。 3.狀態碼應正確使用,如404表示資源不存在。 4.版本控制可通過URI或頭部實現。 5.HATEOAS通過響應中的鏈接引導客戶端操作。

您如何在PHP中有效處理異常(嘗試,捕捉,最後,投擲)? 您如何在PHP中有效處理異常(嘗試,捕捉,最後,投擲)? Apr 05, 2025 am 12:03 AM

在PHP中,異常處理通過try,catch,finally,和throw關鍵字實現。 1)try塊包圍可能拋出異常的代碼;2)catch塊處理異常;3)finally塊確保代碼始終執行;4)throw用於手動拋出異常。這些機制幫助提升代碼的健壯性和可維護性。

PHP中的匿名類是什麼?您何時可以使用它們? PHP中的匿名類是什麼?您何時可以使用它們? Apr 04, 2025 am 12:02 AM

匿名類在PHP中的主要作用是創建一次性使用的對象。 1.匿名類允許在代碼中直接定義沒有名字的類,適用於臨時需求。 2.它們可以繼承類或實現接口,增加靈活性。 3.使用時需注意性能和代碼可讀性,避免重複定義相同的匿名類。

包括,require,incement_once,require_once之間有什麼區別? 包括,require,incement_once,require_once之間有什麼區別? Apr 05, 2025 am 12:07 AM

在PHP中,include,require,include_once,require_once的區別在於:1)include產生警告並繼續執行,2)require產生致命錯誤並停止執行,3)include_once和require_once防止重複包含。這些函數的選擇取決於文件的重要性和是否需要防止重複包含,合理使用可以提高代碼的可讀性和可維護性。

說明PHP中的不同錯誤類型(注意,警告,致命錯誤,解析錯誤)。 說明PHP中的不同錯誤類型(注意,警告,致命錯誤,解析錯誤)。 Apr 08, 2025 am 12:03 AM

PHP中有四種主要錯誤類型:1.Notice:最輕微,不會中斷程序,如訪問未定義變量;2.Warning:比Notice嚴重,不會終止程序,如包含不存在文件;3.FatalError:最嚴重,會終止程序,如調用不存在函數;4.ParseError:語法錯誤,會阻止程序執行,如忘記添加結束標籤。

PHP和Python:比較兩種流行的編程語言 PHP和Python:比較兩種流行的編程語言 Apr 14, 2025 am 12:13 AM

PHP和Python各有優勢,選擇依據項目需求。 1.PHP適合web開發,尤其快速開發和維護網站。 2.Python適用於數據科學、機器學習和人工智能,語法簡潔,適合初學者。

See all articles