Bagaimana Mengira Kekerapan Perkataan dan Isih mengikut Kekerapan dalam Python?

Barbara Streisand
Lepaskan: 2024-10-21 21:39:03
asal
851 orang telah melayarinya

How to Count Word Frequency and Sort by Frequency in Python?

Mengira Kekerapan Perkataan dan Isih Mengikut Kekerapan

Apabila bekerja dengan set data besar yang mengandungi data teks, selalunya perlu menganalisis kekerapan perkataan individu . Maklumat ini boleh digunakan untuk pelbagai tugas pemprosesan bahasa semula jadi (NLP). Dalam Python, tugasan ini boleh dipermudahkan menggunakan alat berkuasa yang dipanggil Counter.

Melaksanakan Reka Bentuk

Reka bentuk anda menggariskan langkah berikut:

  1. Buat senarai kosong untuk menyimpan perkataan unik (baru).
  2. Buat senarai kosong untuk menyimpan frekuensi perkataan (frekuensi) yang sepadan.
  3. Lelaran melalui senarai perkataan asal.
  4. Untuk setiap perkataan, semak sama ada ia sudah berada dalam newlst.
  5. Jika perkataan itu tiada dalam newlst, tambahkannya dan tetapkan kekerapan kepada 1.
  6. Jika perkataan itu sudah dalam newlst , tambah kekerapannya.
  7. Isih newlst berdasarkan senarai kekerapan.

Menggunakan Counter dalam Python

Modul koleksi Python menyediakan khusus kelas yang dipanggil Counter, yang direka untuk mengira dan mengagregatkan elemen dalam iterables. Kaunter membolehkan kami melakukan langkah 3-6 dalam satu baris kod. Begini cara anda boleh melaksanakan reka bentuk anda menggunakan Kaunter:

<code class="python">from collections import Counter

# Create a Counter from the list of words
counts = Counter(original_list)

# Sort the keys (unique words) based on their frequencies
sorted_words = sorted(counts.keys(), key=lambda x: counts[x], reverse=True)</code>
Salin selepas log masuk

Kod ini menjana senarai disusun perkataan unik, di mana perkataan dengan kekerapan tertinggi muncul dahulu.

Contoh

<code class="python">list1 = ['the', 'car', 'apple', 'banana', 'car', 'apple']
counts = Counter(list1)
print(counts)  # Counter({'apple': 2, 'car': 2, 'banana': 1, 'the': 1})
sorted_words = sorted(counts.keys(), key=lambda x: counts[x], reverse=True)
print(sorted_words)  # ['apple', 'car', 'banana', 'the']</code>
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana Mengira Kekerapan Perkataan dan Isih mengikut Kekerapan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!