python统计序列中元素的方法-Python教程-PHP中文网

python统计序列中元素的方法

小云云

发布： 2018-03-29 13:55:40

原创

1746 人浏览过

本文主要为大家详细介绍了python如何统计序列中的元素，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能帮助到大家。

问题1：

随机数列[12,5,8,7,8,9,4,8,5,...] 中出现次数最高的3个元素，他们出现的次数

问题2：

对某英文文章的单词，进行词频统计，找出出现次数最搞得10个单词，他们出现的次数是多少？

上面问题都是以字典的形式保存结果

如何解决问题1？

方法1:

#!/usr/bin/python3
 
from random import randint
 
 
def count_seq(data):
   
  # 初始化统计结果字典,data中的key作为结果字典的key，0作为每个key的初始值
  result_c = dict.fromkeys(data, 0)
   
  # 循环data，对字典中中碰到的值进行 +1 ，循环完成后就是结果
  for x in data:
    result_c[x] += 1
  return result_c
 
if __name__ == &#39;__main__&#39;:
  # 生成２０个随机数
  data = [randint(0, 20) for _ in range(20)]
  print(data)
   
  # 结果
  result_c = count_seq(data)
  for i in result_c:
    print(i, result_c[i])

登录后复制

方法2：

使用 collections下Counter对象

#!/usr/bin/python3
 
from random import randint
from collections import Counter
 
 
def count_seq(data):
   
  # 创建Counter对象，并把打他传递进去
  median_c = Counter(data)
   
  # 返回统计最大的3个数
  return median_c.most_common(3)
 
if __name__ == &#39;__main__&#39;:
  # 生成２０个随机数
  data = [randint(0, 20) for _ in range(20)]
  print(data)
   
  # 结果
  result_c = count_seq(data)
  print(result_c, dict(result_c))

登录后复制

问题2如何解决？

import re
from collections import Counter
 
 
def count_words():
  # 读取文件
  with open(&#39;english_article&#39;, &#39;r&#39;, encoding=&#39;utf-8&#39;) as data:
    print()
    # 文件单词分割
    data_list = re.split(&#39;\W+&#39;, data.read())
  # 单词统计
  words = Counter(data_list)
  # 取单词统计最大的10个值
  return words.most_common(10)
 
if __name__ == &#39;__main__&#39;:
  result = count_words()
  print(result)

登录后复制

以上是python统计序列中元素的方法的详细内容。更多信息请关注PHP中文网其他相关文章！