在最近的项目中,您遇到了一个问题,需要统计列表中单词的出现次数并对其进行排序按频率排列,最常出现的单词位于列表的开头。虽然您对该解决方案有了基本的了解,但不确定如何在 Python 3.3 中有效地实现它。
幸运的是,Python 的 collections.Counter 类为这个问题提供了一个简单而有效的解决方案。下面是一个示例:
<code class="python">from collections import Counter # Create a list of words list1 = ['apple', 'egg', 'apple', 'banana', 'egg', 'apple'] # Use Counter to count word occurrences counts = Counter(list1) # Print the counts print(counts) # Counter({'apple': 3, 'egg': 2, 'banana': 1})</code>
在此示例中,Counter 创建一个类似字典的对象,其中键是单词,值是单词的计数。 print 语句输出每个唯一单词的计数。
要根据频率对单词进行排序,可以使用 Counter 的most_common() 方法。此方法返回一个元组列表,其中每个元组包含一个单词及其计数。默认情况下,列表按频率降序排序,这意味着最常见的单词将位于开头。
以下是对单词列表进行排序的方法:
<code class="python"># Sort the words based on frequency sorted_words = [word for word, count in sorted(counts.most_common(), key=lambda x: x[1], reverse=True)] # Print the sorted list print(sorted_words) # ['apple', 'egg', 'banana']</code>
在此代码,使用reverse = True参数按第二个元素(计数)按降序对元组列表进行排序。这可确保最常见的单词在排序单词列表中排在第一位。
以上是如何使用 Counter 在 Python 中对词频进行计数和排序?的详细内容。更多信息请关注PHP中文网其他相关文章!