使用Python中的NRC字典進行情感分類
情緒辨識或辨識是一個人或一個物體感知環境中表現出的特定情緒並將其放入多種情緒類別之一的能力.
Python 中的情感分類是傳統情感分析技術的可行替代方案,傳統情感分析技術將單字或句子標記為積極或消極並分配它們相應地具有極性分數。
這個演算法背後的基本思想是模仿人類思考過程,它試圖從文本中分割出描繪情感的單字。使用訓練資料集執行分析,其中一組預設資訊被輸入到系統中,作為分類的基礎。
這是基於 NLTK 庫 中的WordNet 同義詞集和加拿大國家研究委員會(NRC) 的情感詞典的軟體包,該詞典已超過 27,000 個術語。
圖書館使用以下類別來衡量和分類單字的情緒效果 -
恐懼
憤怒
期待
信任
驚喜
積極
負片
悲傷
厭惡
喜悅
#安裝步驟
第 1 步 - 在終端機中使用 pip install 指令安裝 NRC 模組。
pip install NRCLex
在 jupyter 中安裝
筆記本和命令提示字元通常遵循相同的步驟。在 MacO 中安裝也遵循相同的命令。直接使用終端。
第 2 步 - 另外安裝 textblob 和 nrclex 以避免遇到 MissingCorpusError
ul>#
第 3 步 - 從 textblob 下載語料庫
pip install textblob
python -m textblob.download_corpora
安裝後,我們可以繼續匯入庫並建立文字物件。
基本方法
1.原始文字到過濾後的文字(為了獲得最佳結果,「文字」應該是 unicode)。
text_object.load_raw_text(text: str)
2.將標記化的單字清單轉換為標記清單
#text_object.load_token_list(list_of_tokens: list)
3.傳回單字清單。
text_object.words
4。返回句子列表。
text_object.sentences
5。返回影響列表。
text_object.affect_list
6。返回影響字典。
text_object.affect_dict
7.傳回原始情緒數。
text_object.raw_emotion_scores
8。回最高的情緒。
text_object.top_emotions
9。返回頻率。
Text_object.frequencies
在這裡,我們使用 top_emotions 函數根據情緒對單字清單進行分類。
演算法
第 1 步 - 導入 nrclex 導入 nrclex
步驟 2 - 從 nrclex 匯入 NRCLex
第 3 步 - 初始化您想要分類的字串單字清單
步驟 4 - 對於範圍 len(text) 內的 i
第 4 步 -情緒 = NRCLex(text[i]) #為每個文字建立一個物件
第 5 步 -情緒.top_emotions #對情緒進行分類
範例
# Import module import nrclex from nrclex import NRCLex text = ['happy', 'beautiful', 'exciting', 'depressed'] # Iterate through list for i in range(len(text)): # call by object creation emotion = NRCLex(text[i]) # Classify emotion print('\n', text[i], ': ', emotion.top_emotions)
輸出
innocent : [('trust', 0.5), ('positive', 0.5)] hate : [('fear', 0.2), ('anger', 0.2), ('negative', 0.2), ('sadness', 0.2), ('disgust', 0.2)] irritating : [('anger', 0.3333333333333333), ('negative', 0.3333333333333333), ('disgust', 0.3333333333333333)] annoying : [('anger', 0.5), ('negative', 0.5)]
演算法
第 1 步 - 導入 nrclex
#步驟 2 - 從 nrclex 匯入 NRCLex
第 3 步 - 初始化您想要分類的字串單字清單
步驟 4 - 對於範圍 len(text) 內的 i
第 4 步 -情緒 = NRCLex(text[i]) #為每個文字建立一個物件
第 5 步 -情緒.top_emotions #對情緒進行分類
範例
import nrclex from nrclex import NRCLex # Assign list of strings text = ['innocent','hate', 'irritating','annoying'] # Iterate through list for i in range(len(text)): # Create object emotion = NRCLex(text[i]) # Classify emotion print('\n\n', text[i], ': ', emotion.top_emotions)
輸出
innocent : [('trust', 0.5), ('positive', 0.5)] hate : [('fear', 0.2), ('anger', 0.2), ('negative', 0.2), ('sadness', 0.2), ('disgust', 0.2)] irritating : [('anger', 0.3333333333333333), ('negative', 0.3333333333333333), ('disgust', 0.3333333333333333)] annoying : [('anger', 0.5), ('negative', 0.5)]
結論
NRC 情緒字典廣泛應用於研究和工業領域的情緒分析和情緒分類任務。這意味著有大量的用戶和資源社群可用於支援和進一步開發。 NRCLex 還借助谷歌翻譯,為全球 100 多種語言提供穩定的產出,成功打破了語言障礙。這在醫療保健領域有多種應用,可以幫助理解流行病應對措施。實際應用包括心理學和行為科學、假新聞檢測和增強人機互動。
以上是使用Python中的NRC字典進行情感分類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

VS Code可以在Windows 8上運行,但體驗可能不佳。首先確保系統已更新到最新補丁,然後下載與系統架構匹配的VS Code安裝包,按照提示安裝。安裝後,注意某些擴展程序可能與Windows 8不兼容,需要尋找替代擴展或在虛擬機中使用更新的Windows系統。安裝必要的擴展,檢查是否正常工作。儘管VS Code在Windows 8上可行,但建議升級到更新的Windows系統以獲得更好的開發體驗和安全保障。

VS Code 可用於編寫 Python,並提供許多功能,使其成為開發 Python 應用程序的理想工具。它允許用戶:安裝 Python 擴展,以獲得代碼補全、語法高亮和調試等功能。使用調試器逐步跟踪代碼,查找和修復錯誤。集成 Git,進行版本控制。使用代碼格式化工具,保持代碼一致性。使用 Linting 工具,提前發現潛在問題。

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後,在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。

VS Code 擴展存在惡意風險,例如隱藏惡意代碼、利用漏洞、偽裝成合法擴展。識別惡意擴展的方法包括:檢查發布者、閱讀評論、檢查代碼、謹慎安裝。安全措施還包括:安全意識、良好習慣、定期更新和殺毒軟件。
