Cara menggunakan antara muka ECharts dan Python untuk menjana gambarajah awan perkataan
Pengenalan:
Dengan kemunculan era data besar, visualisasi data telah menjadi bahagian penting dalam analisis data. Sebagai kaedah visualisasi data biasa, graf awan perkataan mempunyai kelebihan unik dalam memaparkan pengedaran dan korelasi perkataan panas dalam data teks. Artikel ini akan memperkenalkan cara menggunakan antara muka ECharts dan Python untuk menjana gambar rajah awan perkataan, dan memberikan contoh kod khusus.
1. Penyediaan:
Sebelum bermula, kita perlu memasang perpustakaan berkaitan ECharts dan Python. Mula-mula, kita perlu memasang ECharts melalui arahan berikut:
npm install echarts
Kemudian, kita perlu memasang perpustakaan pyecharts dalam Python, yang boleh dilengkapkan melalui arahan berikut:
pip install pyecharts
Selepas pemasangan selesai, kita juga perlu memasang perpustakaan jieba untuk segmentasi perkataan Cina boleh dipasang melalui arahan berikut:
pip install jieba
2. Pemprosesan data:
Sebelum menjana graf awan perkataan, kita perlu memproses dan mempraproses data teks untuk dianalisis. Mula-mula, baca data teks ke dalam Python Anda boleh menggunakan fungsi read_csv() dalam perpustakaan panda untuk membaca data teks. Seterusnya, kita perlu melakukan pembahagian perkataan bahasa Cina pada data teks Di sini kita menggunakan perpustakaan jieba untuk mengendalikan tugas pembahagian perkataan. Kod khusus adalah seperti berikut:
import pandas as pd import jieba # 读取文本数据 data = pd.read_csv('data.csv', encoding='utf-8') # 对文本进行分词 def cut_words(text): return " ".join(jieba.cut(text)) # 应用分词函数 data['segment'] = data['text'].apply(cut_words) # 保存分词后的数据 data.to_csv('segment_data.csv', encoding='utf-8', index=False)
Dalam kod di atas, data teks disimpan sebagai fail data.csv dan data yang diproses disimpan sebagai fail segment_data.csv.
3. Hasilkan graf awan perkataan:
Selepas kami menyelesaikan prapemprosesan data, kami boleh mula menjana graf awan perkataan. Di sini, kami akan menggunakan komponen WordCloud daripada pustaka pyecharts untuk menjana graf awan perkataan. Kod khusus adalah seperti berikut:
from pyecharts.charts import WordCloud from pyecharts import options as opts # 读取分词后的数据 segment_data = pd.read_csv('segment_data.csv', encoding='utf-8')['segment'].tolist() # 统计词频 word_count = {} for text in segment_data: words = text.split() for word in words: if word in word_count: word_count[word] += 1 else: word_count[word] = 1 # 生成词云图 wordcloud = ( WordCloud() .add("", list(word_count.items()), word_size_range=[20, 100]) .set_global_opts(title_opts=opts.TitleOpts(title="词云图")) ) # 保存词云图 wordcloud.render('wordcloud.html')
Dalam kod di atas, kita mula-mula membaca data segmentasi perkataan, dan kemudian mengira kekerapan perkataan setiap perkataan. Seterusnya, gunakan komponen WordCloud untuk menjana carta awan perkataan dan tetapkan tajuk kepada "Carta Awan Kata". Akhir sekali, simpan graf awan perkataan yang dijana sebagai fail wordcloud.html.
4. Paparkan graf awan perkataan:
Selepas menjana graf awan perkataan, kami boleh memaparkan keputusan pada halaman web, yang boleh dicapai menggunakan rangka kerja Flask. Kod khusus adalah seperti berikut:
from flask import Flask, render_template app = Flask(__name__) @app.route("/") def index(): return render_template('wordcloud.html') if __name__ == "__main__": app.run()
Dalam kod di atas, kami mencipta aplikasi mudah berdasarkan rangka kerja Flask Apabila direktori akar diakses dalam pelayar, gambarajah awan perkataan yang dijana akan dipaparkan.
Kesimpulan:
Artikel ini memperkenalkan langkah khusus tentang cara menggunakan antara muka ECharts dan Python untuk menjana gambar rajah awan perkataan, dan menyediakan contoh kod yang sepadan. Dengan menguasai pengetahuan asas ini, kami boleh menggunakan alat visualisasi data dengan lebih baik untuk memaparkan ciri dan korelasi data teks dan menyediakan rujukan yang lebih intuitif untuk analisis data. Harap artikel ini membantu anda!
Atas ialah kandungan terperinci Bagaimana untuk menjana graf awan perkataan menggunakan antara muka ECharts dan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!