Dalam artikel ini, kami akan menambah perwakilan grafik hasil analisis sentimen menggunakan Matplotlib. Matlamatnya adalah untuk menggambarkan skor sentimen berbilang ayat, dengan carta bar yang membezakan sentimen positif dan negatif menggunakan warna yang berbeza.
Pastikan anda telah memasang perpustakaan berikut:
pip install transformers torch matplotlib
Berikut ialah kod Python yang dikemas kini yang menyepadukan analisis sentimen dengan visualisasi data.
import matplotlib.pyplot as plt from transformers import pipeline from transformers import AutoTokenizer, AutoModelForSequenceClassification # Load pre-trained model and tokenizer model_name = "distilbert-base-uncased-finetuned-sst-2-english" model = AutoModelForSequenceClassification.from_pretrained(model_name) tokenizer = AutoTokenizer.from_pretrained(model_name) # Initialize the sentiment-analysis pipeline classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer) # List of 10 sentences for sentiment analysis sentences = [ "I love you! I love you! I love you!", "I feel so sad today.", "This is the best day ever!", "I can't stand the rain.", "Everything is going so well.", "I hate waiting in line.", "The weather is nice, but it's cold.", "I'm so proud of my achievements.", "I am very upset with the decision.", "I am feeling optimistic about the future." ] # Prepare data for the chart scores = [] colors = [] for sentence in sentences: result = classifier(sentence) sentiment = result[0]['label'] score = result[0]['score'] scores.append(score) # Color bars based on sentiment: Positive -> green, Negative -> red if sentiment == "POSITIVE": colors.append("green") else: colors.append("red") # Create a bar chart plt.figure(figsize=(10, 6)) bars = plt.bar(sentences, scores, color=colors) # Add labels and title with a line break plt.xlabel('Sentences') plt.ylabel('Sentiment Score') plt.title('Sentiment Analysis of 10 Sentences\n') # Added newline here plt.xticks(rotation=45, ha="right") # Adjust spacing with top margin (to add ceiling space) plt.subplots_adjust(top=0.85) # Adjust the top spacing (20px roughly equivalent to 0.1 top margin) plt.tight_layout() # Adjusts the rest of the layout # Display the sentiment score on top of the bars for bar in bars: yval = bar.get_height() plt.text(bar.get_x() + bar.get_width() / 2, yval + 0.02, f'{yval:.2f}', ha='center', va='bottom', fontsize=9) # Show the plot plt.show()
Mengimport Perpustakaan yang Diperlukan:
Kami mengimport matplotlib.pyplot untuk mencipta plot dan transformer untuk melaksanakan analisis sentimen.
import matplotlib.pyplot as plt from transformers import pipeline from transformers import AutoTokenizer, AutoModelForSequenceClassification
Memuatkan Model Pra-latihan:
Kami memuatkan model DistilBERT yang diperhalusi untuk analisis sentimen pada set data SST-2. Kami juga memuatkan tokenizer yang berkaitan yang menukar teks kepada token yang boleh dibaca model.
model_name = "distilbert-base-uncased-finetuned-sst-2-english" model = AutoModelForSequenceClassification.from_pretrained(model_name) tokenizer = AutoTokenizer.from_pretrained(model_name)
Memulakan Saluran Analisis Sentimen:
Saluran paip pengelas disediakan untuk analisis sentimen. Saluran paip ini menjaga tokenisasi teks input, melakukan inferens dan mengembalikan hasilnya.
classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer)
Ayat untuk Analisis Sentimen:
Kami membuat senarai 10 ayat untuk dianalisis. Setiap ayat ialah ungkapan sentimen yang unik, daripada sangat positif hingga negatif.
sentences = [ "I love you! I love you! I love you!", "I feel so sad today.", "This is the best day ever!", "I can't stand the rain.", "Everything is going so well.", "I hate waiting in line.", "The weather is nice, but it's cold.", "I'm so proud of my achievements.", "I am very upset with the decision.", "I am feeling optimistic about the future." ]
Memproses Sentimen dan Menyediakan Data:
Untuk setiap ayat, kami mengklasifikasikan sentimennya dan mengeluarkan skornya. Berdasarkan label sentimen (POSITIF atau NEGATIF), kami menetapkan warna untuk bar dalam carta. Ayat positif akan berwarna hijau, manakala ayat negatif akan menjadi merah.
scores = [] colors = [] for sentence in sentences: result = classifier(sentence) sentiment = result[0]['label'] score = result[0]['score'] scores.append(score) if sentiment == "POSITIVE": colors.append("green") else: colors.append("red")
Membuat Carta Bar:
Kami menggunakan matplotlib untuk mencipta carta bar. Ketinggian setiap bar mewakili skor sentimen untuk ayat, dan warna membezakan sentimen positif dan negatif.
plt.figure(figsize=(10, 6)) bars = plt.bar(sentences, scores, color=colors)
Menambah Label dan Melaraskan Reka Letak:
Kami menyesuaikan penampilan plot dengan memutarkan label paksi-x untuk kebolehbacaan yang lebih baik, menambah tajuk dan melaraskan reka letak untuk jarak optimum.
plt.xlabel('Sentences') plt.ylabel('Sentiment Score') plt.title('Sentiment Analysis of 10 Sentences\n') # Added newline here plt.xticks(rotation=45, ha="right") plt.subplots_adjust(top=0.85) # Adjust the top spacing plt.tight_layout() # Adjusts the rest of the layout
Memaparkan Markah Sentimen di Atas Bar:
Kami juga memaparkan skor sentimen di atas setiap bar untuk menjadikan carta lebih bermaklumat.
pip install transformers torch matplotlib
Memaparkan Plot:
Akhir sekali, carta dipaparkan menggunakan plt.show(), yang memaparkan plot.
import matplotlib.pyplot as plt from transformers import pipeline from transformers import AutoTokenizer, AutoModelForSequenceClassification # Load pre-trained model and tokenizer model_name = "distilbert-base-uncased-finetuned-sst-2-english" model = AutoModelForSequenceClassification.from_pretrained(model_name) tokenizer = AutoTokenizer.from_pretrained(model_name) # Initialize the sentiment-analysis pipeline classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer) # List of 10 sentences for sentiment analysis sentences = [ "I love you! I love you! I love you!", "I feel so sad today.", "This is the best day ever!", "I can't stand the rain.", "Everything is going so well.", "I hate waiting in line.", "The weather is nice, but it's cold.", "I'm so proud of my achievements.", "I am very upset with the decision.", "I am feeling optimistic about the future." ] # Prepare data for the chart scores = [] colors = [] for sentence in sentences: result = classifier(sentence) sentiment = result[0]['label'] score = result[0]['score'] scores.append(score) # Color bars based on sentiment: Positive -> green, Negative -> red if sentiment == "POSITIVE": colors.append("green") else: colors.append("red") # Create a bar chart plt.figure(figsize=(10, 6)) bars = plt.bar(sentences, scores, color=colors) # Add labels and title with a line break plt.xlabel('Sentences') plt.ylabel('Sentiment Score') plt.title('Sentiment Analysis of 10 Sentences\n') # Added newline here plt.xticks(rotation=45, ha="right") # Adjust spacing with top margin (to add ceiling space) plt.subplots_adjust(top=0.85) # Adjust the top spacing (20px roughly equivalent to 0.1 top margin) plt.tight_layout() # Adjusts the rest of the layout # Display the sentiment score on top of the bars for bar in bars: yval = bar.get_height() plt.text(bar.get_x() + bar.get_width() / 2, yval + 0.02, f'{yval:.2f}', ha='center', va='bottom', fontsize=9) # Show the plot plt.show()
Keluaran kod ini ialah carta bar yang memaparkan skor sentimen bagi 10 ayat. Ayat positif akan diwakili oleh bar hijau, manakala ayat negatif akan ditunjukkan sebagai bar merah. Skor sentimen akan dipaparkan di atas setiap bar, menunjukkan tahap keyakinan model.
Dengan menggabungkan analisis sentimen dengan visualisasi data, kami boleh mentafsir dengan lebih baik nada emosi di sebalik data teks. Perwakilan grafik dalam artikel ini menawarkan pemahaman yang lebih jelas tentang pengedaran sentimen, membolehkan anda melihat arah aliran dalam teks dengan mudah. Anda boleh menggunakan teknik ini pada pelbagai kes penggunaan seperti menganalisis ulasan produk, siaran media sosial atau maklum balas pelanggan.
Dengan gabungan kuat transformer Hugging Face dan matplotlib, aliran kerja ini boleh dilanjutkan dan disesuaikan untuk disesuaikan dengan pelbagai tugas NLP.
Atas ialah kandungan terperinci Memvisualisasikan Keputusan Analisis Sentimen dalam Python menggunakan Matplotlib. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!