Dengan populariti Internet dan media sosial, orang ramai semakin memberi perhatian kepada analisis emosi pengguna dan pengguna. Antaranya, analisis sentimen ialah kaedah perlombongan teks berasaskan teknologi pemprosesan bahasa semula jadi yang dapat mengenal pasti kecenderungan emosi dalam teks, termasuk emosi positif, negatif atau neutral. Python ialah bahasa pengaturcaraan popular yang juga digunakan secara meluas dalam pemprosesan bahasa semula jadi dan analisis sentimen. Dalam artikel ini, kami akan memperkenalkan cara menggunakan Python untuk analisis sentimen.
Melaksanakan analisis sentimen dalam Python memerlukan penggunaan beberapa perpustakaan pergantungan yang diperlukan. Antaranya, yang paling biasa digunakan ialah Natural Language Toolkit (NLTK) dan TextBlob. Kita boleh memasangnya dengan arahan berikut:
!pip install nltk !pip install textblob
Sebelum melakukan analisis sentimen, data perlu dipraproses. Ini termasuk langkah-langkah seperti penyingkiran perkataan henti, penyusunan dan vektorisasi perkataan. Berikut ialah proses prapemprosesan data yang mudah:
import nltk from textblob import TextBlob from nltk.corpus import stopwords from nltk.stem import PorterStemmer # 下载停用词和词根词库 nltk.download('stopwords') nltk.download('wordnet') # 删除停用词和进行词干提取 stop_words = set(stopwords.words('english')) stemmer = PorterStemmer() def pre_processing(text): text = text.lower() # 转化为小写字母 words = TextBlob(text).words # 将文本划分为单词 words = [w for w in words if not w in stop_words] # 删除停用词 words = [stemmer.stem(word) for word in words] # 进行词干提取 return ' '.join(words) # 将单词连接成文本
Gunakan perpustakaan TextBlob untuk melaksanakan analisis sentimen dengan cepat. Berikut ialah contoh analisis sentimen mudah:
from textblob import TextBlob text = "I love Python programming" processed_text = pre_processing(text) blob = TextBlob(processed_text) polarity = blob.sentiment.polarity # 获取极性分数 if polarity > 0: print("这是正面情感") elif polarity < 0: print("这是负面情感") else: print("这是中性情感")
Selain perpustakaan TextBlob, terdapat beberapa alat analisis sentimen popular lain seperti perpustakaan NLTK dan Scikit-Learn. Perpustakaan ini menyediakan lebih banyak fungsi dan pilihan, membolehkan anda memproses dan menganalisis data anda dengan lebih baik.
Analisis sentimen digunakan secara meluas dalam banyak bidang, termasuk pengurusan jenama, pemasaran dan pemantauan media sosial. Berikut ialah contoh mudah yang menunjukkan cara menganalisis ulasan pada tapak web e-dagang dan mengekstrak maklumat sentimen daripadanya.
import pandas as pd # 读取评论数据 data = pd.read_csv('reviews.csv') # 进行情感分析 def get_polarity(text): return TextBlob(pre_processing(text)).sentiment.polarity data['polarity'] = data['text'].apply(get_polarity) # 输出情感分数 print(data['polarity'].describe())
Kod di atas akan membaca set data ulasan bernama "reviews.csv" dan melakukan analisis sentimen menggunakan fungsi prapemprosesan dan TextBlob. Akhir sekali, statistik ringkasan skor sentimen ulasan adalah output.
Ringkasan
Python ialah bahasa pengaturcaraan yang popular dengan aplikasi luas dalam bidang pemprosesan bahasa semula jadi dan analisis sentimen. Anda boleh melakukan analisis sentimen menggunakan Python dengan menggunakan beberapa perpustakaan pergantungan biasa seperti NLTK dan TextBlob. Analisis sentimen boleh membantu anda memahami dengan lebih baik perasaan pengguna dan pengguna tentang produk atau perkhidmatan serta menyokong keputusan seperti pengurusan jenama dan pemasaran.
Atas ialah kandungan terperinci Bagaimana untuk menggunakan Python untuk analisis sentimen?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!