Python中的自然語言處理實例：情感分析-Python教學-PHP中文網

首頁

後端開發

Python教學

Python中的自然語言處理實例：情感分析

王林

Jun 11, 2023 am 08:26 AM

python 自然語言處理情緒分析

Python中的自然語言處理實例：情感分析

隨著人工智慧的發展，自然語言處理（NLP）在各個領域中越來越受到關注。其中，情緒分析是NLP應用的重要方向。情感分析可以用來分析使用者對產品、服務或事件的情感傾向，幫助企業更好地理解消費者需求，促進行銷策略的發展。本文將介紹Python中進行情緒分析的實例。

安裝必要的函式庫

在Python中進行情緒分析，需要使用第三方函式庫Natural Language Toolkit（NLTK）和TwitterAPI。可以使用pip來安裝這兩個函式庫：

pip install nltk
pip install TwitterAPI

登入後複製

資料預處理

在進行情緒分析之前，需要先對文字進行預處理。可以統一將文字轉換成小寫字母，去除標點符號、數字、停用詞等無關訊息。預處理的程式碼如下：

import re
from nltk.corpus import stopwords

def clean_text(text):
    text = text.lower() # 将文本转换成小写字母
    text = re.sub(r'[^ws]', '', text) # 去除标点符号
    text = re.sub(r'd+', '', text) # 去除数字
    stop_words = set(stopwords.words('english'))
    words = text.split()
    words = [w for w in words if w not in stop_words] # 去除停用词
    text = ' '.join(words)
    return text

登入後複製

情緒分析模型

接下來，需要建立一個情緒分析模型。由於情緒分析屬於監督式學習（即需要標註好的資料），因此建立模型需要有標註好的訓練資料。此處使用來自NLTK的電影評論資料集，其中包含1000條帶有正面或負面情感傾向的評論。這些評論已經被標記好了。

import nltk
from nltk.corpus import movie_reviews
import random

documents = [(list(movie_reviews.words(fileid)), category)
             for category in movie_reviews.categories()
             for fileid in movie_reviews.fileids(category)]

random.shuffle(documents)

登入後複製

在得到訓練資料之後，可以透過使用nltk中的NaiveBayesClassifier來建立一個樸素貝葉斯分類器。程式碼如下：

all_words = nltk.FreqDist(w.lower() for w in movie_reviews.words())
word_features = list(all_words.keys())[:2000]

def document_features(document):
    document_words = set(document)
    features = {}
    for word in word_features:
        features['contains({})'.format(word)] = (word in document_words)
    return features

featuresets = [(document_features(d), c) for (d,c) in documents]
train_set, test_set = featuresets[200:], featuresets[:200]
classifier = nltk.NaiveBayesClassifier.train(train_set)

登入後複製

這個分類器是基於樸素貝葉斯演算法，使用訓練資料的特徵來進行分類。在本實例中，使用的是以單字形式為特徵的「包含（word）」函數。這個函數會檢查文件是否包含了這個單字。

情緒分析應用

完成模型的建立後，就可以使用它來進行情緒分析。在這個實例中，利用TwitterAPI從Twitter上取得推文，然後對推文進行情緒分析。

from TwitterAPI import TwitterAPI
import json

consumer_key = 'your consumer key'
consumer_secret = 'your consumer secret'
access_token_key = 'your access token key'
access_token_secret = 'your access token secret'

api = TwitterAPI(consumer_key,
                 consumer_secret,
                 access_token_key,
                 access_token_secret)

def analyze_tweet(tweet):
    tweet_text = tweet['text']
    tweet_clean = clean_text(tweet_text)
    tweet_features = document_features(tweet_clean.split())
    sentiment = classifier.classify(tweet_features)
    return sentiment

keywords = 'Trump'

for tweet in api.request('search/tweets', {'q': keywords, 'lang': 'en', 'count': 10}):
    sentiment = analyze_tweet(tweet)
    print(tweet['text'])
    print(sentiment)
    print('
')

登入後複製

這個程式碼片段利用TwitterAPI取得包含關鍵字「Trump」的最新的10條推文。然後，對每條推文進行情緒分析，並輸出情感傾向。

除了Twitter外，還可以使用這個模型在其他的文字資料上進行情緒分析。

結論

這篇文章介紹了Python中的情緒分析實例。這個實例利用訓練有素的樸素貝葉斯分類器對文本進行分類，可以用來判斷文本的情感傾向。情感分析可以在行銷和社群媒體監測等領域中廣泛應用。

以上是Python中的自然語言處理實例：情感分析的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7500

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

HadiDB：Python 中的輕量級、可水平擴展的數據庫 Apr 08, 2025 pm 06:12 PM

HadiDB：輕量級、高水平可擴展的Python數據庫HadiDB(hadidb)是一個用Python編寫的輕量級數據庫，具備高度水平的可擴展性。安裝HadiDB使用pip安裝：pipinstallhadidb用戶管理創建用戶：createuser()方法創建一個新用戶。 authentication()方法驗證用戶身份。 fromhadidb.operationimportuseruser_obj=user("admin","admin")user_obj.

Navicat查看MongoDB數據庫密碼的方法 Apr 08, 2025 pm 09:39 PM

直接通過 Navicat 查看 MongoDB 密碼是不可能的，因為它以哈希值形式存儲。取回丟失密碼的方法：1. 重置密碼；2. 檢查配置文件（可能包含哈希值）；3. 檢查代碼（可能硬編碼密碼）。

如何針對高負載應用程序優化 MySQL 性能？ Apr 08, 2025 pm 06:03 PM

MySQL數據庫性能優化指南在資源密集型應用中，MySQL數據庫扮演著至關重要的角色，負責管理海量事務。然而，隨著應用規模的擴大，數據庫性能瓶頸往往成為製約因素。本文將探討一系列行之有效的MySQL性能優化策略，確保您的應用在高負載下依然保持高效響應。我們將結合實際案例，深入講解索引、查詢優化、數據庫設計以及緩存等關鍵技術。 1.數據庫架構設計優化合理的數據庫架構是MySQL性能優化的基石。以下是一些核心原則：選擇合適的數據類型選擇最小的、符合需求的數據類型，既能節省存儲空間，又能提升數據處理速度

Python：探索其主要應用程序 Apr 10, 2025 am 09:41 AM

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中，Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域，NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面，Python適用於自動化測試和系統管理等任務。

2小時的Python計劃：一種現實的方法 Apr 11, 2025 am 12:04 AM

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型，2.掌握控制流（條件語句和循環），3.理解函數的定義和使用，4.通過簡單示例和代碼片段快速上手Python編程。

如何將 AWS Glue 爬網程序與 Amazon Athena 結合使用 Apr 09, 2025 pm 03:09 PM

作為數據專業人員，您需要處理來自各種來源的大量數據。這可能會給數據管理和分析帶來挑戰。幸運的是，兩項 AWS 服務可以提供幫助：AWS Glue 和 Amazon Athena。

mysql 可以連接到 sql 服務器嗎 Apr 08, 2025 pm 05:54 PM

否，MySQL 無法直接連接到 SQL Server。但可以使用以下方法實現數據交互：使用中間件：將數據從 MySQL 導出到中間格式，然後通過中間件導入到 SQL Server。使用數據庫鏈接器：商業工具可提供更友好的界面和高級功能，本質上仍通過中間件方式實現。

redis怎麼啟動服務器 Apr 10, 2025 pm 08:12 PM

啟動 Redis 服務器的步驟包括：根據操作系統安裝 Redis。通過 redis-server（Linux/macOS）或 redis-server.exe（Windows）啟動 Redis 服務。使用 redis-cli ping（Linux/macOS）或 redis-cli.exe ping（Windows）命令檢查服務狀態。使用 Redis 客戶端，如 redis-cli、Python 或 Node.js，訪問服務器。

See all articles

Python中的自然語言處理實例：情感分析

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題