目录
第 1 步:创建您的虚拟环境
第 2 步:阅读文本
第 3 步:分析字符
第4步:画出来!
结论
首页 后端开发 Python教程 使用 Python 和 Matplotlib 在文本中绘制字符

使用 Python 和 Matplotlib 在文本中绘制字符

Apr 29, 2023 pm 07:31 PM
python 数据 matplotlib

本文的目的是帮助您开始在 python 中绘制数据。 我们将创建一个条形图来绘制给定文本文件中字符的频率。 在这种情况下,文本文件包含了《了不起的盖茨比》的内容。

使用 Python 和 Matplotlib 在文本中绘制字符

第 1 步:创建您的虚拟环境

这个项目的环境会比较小。 虚拟环境允许您向工作区添加额外的功能,而不会影响计算机的其余部分!

创建一个目录并在代码编辑器和终端(运行命令的地方)中打开它。

让我们运行:

$ python3 -m venv venv
$ source venv/bin/activate
登录后复制

我们可以安装我们必要的依赖项

$ pip3 install matplotlib
登录后复制

我们还要创建两个文件,read.txt 和 wordcount.py。

我们将使用 wordcount.py 来分析 read.txt 中的文本。

第 2 步:阅读文本

我们可以比较简单的开始,

import matplotlib.pyplot as plt # plot
from collections import OrderedDict # this will be used for sorting later

file = open('read.txt')
text = file.read()
file.close()
登录后复制
  • 首先,它导入我们的绘图和排序库
  • 其次,我们使用内置的 open 函数,它允许我们打开一个文件进行读写
  • 然后我们读取文件里面的文本并将其存储到文本变量中
  • 最后,我们关闭文件,因为我们不再使用它了

这就是我们“读取”文件并将内容存储在变量中所需的全部内容。

第 3 步:分析字符

我们可以跟踪字符的最好方法是使用 python 字典(在其他编程语言中称为 hashmap)。

字典是一种非常有用的数据存储方式。 就像真正的字典一样,它会有一个“单词”列表,您可以查看单词以查看定义。

在编程中,这个概念被推广到“键/值”对。 这意味着我们可以设置字典,当我向字典询问“a”时,它将返回“a”出现的总次数。

所以让我们编码吧!

charDict = {} # dictionaries are defined by curly braces
def count_letter(character):
character = character.lower()
if character.isspace():
return
if character in charDict:
charDict[character] = charDict[character] + 1
else:
charDict[character] = 1

# loop through text
for i in text:
count_letter(i)

charDict = OrderedDict(sorted(charDict.items()))
登录后复制

让我们回顾一下这里发生了什么。

  • 首先我们定义一个空字典
  • 接下来我们使用 def 关键字定义一个函数。 这个函数接受一个变量“字符”,检查它是否是一个空格(空格、制表符、换行符)。 您可以为您的选择添加其他标准,例如 isalpha() 以确定字符是否为字母
  • 然后检查它是否已经在字典中。 如果它在字典中,它会将值更改为之前的值加 1(因为我们正在计算这个字符),否则它将在字典中添加一个初始计数为 1 的新条目
  • 然后我们遍历文本变量中的每个字符,其中“i”代表一个单独的字符,我们保存并运行我们的函数来计算它们
  • 最后,我们使用 OrderdedDict 导入按字母顺序对字典进行排序

第4步:画出来!

现在我们的数据集已创建,让我们将其组织成轴并绘制它!

我们将创建一个列表来表示每个轴

num_list = []
char_list = []

这些列表将相互对应,因此如果 char_list 中的第 1 项是“a”,则 num_list 中的第 1 项将是相应的频率。 让我们也把它编码出来。

char_list = [] # character
num_list = [] # frequency
# create x and y axes
for x,y in charDict.items():
char_list.append(x)
num_list.append(y)
登录后复制

我们使用两个变量循环遍历我们创建的字典中的键/值对,然后将它们添加到我们的数据列表中。

最后让我们使用 matplotlib 创建并保存这个条形图。

fig = plt.figure() # create a new figure
ax = fig.add_subplot() # create a new bar graph within the figure
fig.canvas.manager.set_window_title('The Great Gatsby') # title of window
ax.bar(char_list, num_list) # add the data to the graph
plt.savefig('chars.png') # download an image of the bar graph
plt.show() # show the image
登录后复制
  • 首先,我们创建一个新图形。 图为整体窗口
  • 向图中添加绘图
  • 使用我们选择的数据添加条形图
  • 下载图片
  • 显示图像

是时候测试它了!

使用下面的代码运行您的文件,为我们的结果做好准备!

$ python3 wordcount.py
登录后复制

使用 Python 和 Matplotlib 在文本中绘制字符

所以要回答我在文章开头提出的问题,字母 e 在《了不起的盖茨比》中被使用了超过 25,000 次! 哇!

结论

在本文结束时,我希望您对 matplotlib 和数据科学有所了解。

以上是使用 Python 和 Matplotlib 在文本中绘制字符的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

PS羽化如何控制过渡的柔和度? PS羽化如何控制过渡的柔和度? Apr 06, 2025 pm 07:33 PM

羽化控制的关键在于理解其渐变本质。PS本身不提供直接控制渐变曲线的选项,但你可以通过多次羽化、配合蒙版、精细选区,灵活调整半径和渐变柔和度,实现自然过渡效果。

mysql安装后怎么使用 mysql安装后怎么使用 Apr 08, 2025 am 11:48 AM

文章介绍了MySQL数据库的上手操作。首先,需安装MySQL客户端,如MySQLWorkbench或命令行客户端。1.使用mysql-uroot-p命令连接服务器,并使用root账户密码登录;2.使用CREATEDATABASE创建数据库,USE选择数据库;3.使用CREATETABLE创建表,定义字段及数据类型;4.使用INSERTINTO插入数据,SELECT查询数据,UPDATE更新数据,DELETE删除数据。熟练掌握这些步骤,并学习处理常见问题和优化数据库性能,才能高效使用MySQL。

mysql 是否要付费 mysql 是否要付费 Apr 08, 2025 pm 05:36 PM

MySQL 有免费的社区版和收费的企业版。社区版可免费使用和修改,但支持有限,适合稳定性要求不高、技术能力强的应用。企业版提供全面商业支持,适合需要稳定可靠、高性能数据库且愿意为支持买单的应用。选择版本时考虑的因素包括应用关键性、预算和技术技能。没有完美的选项,只有最合适的方案,需根据具体情况谨慎选择。

PS羽化怎么设置? PS羽化怎么设置? Apr 06, 2025 pm 07:36 PM

PS羽化是一种图像边缘模糊效果,通过在边缘区域对像素加权平均实现。设置羽化半径可以控制模糊程度,数值越大越模糊。灵活调整半径可根据图像和需求优化效果,如处理人物照片时使用较小半径保持细节,处理艺术作品时使用较大半径营造朦胧感。但需注意,半径过大易丢失边缘细节,过小则效果不明显。羽化效果受图像分辨率影响,且需要根据图像理解和效果把握进行调整。

PS羽化对图像质量有什么影响? PS羽化对图像质量有什么影响? Apr 06, 2025 pm 07:21 PM

PS羽化会导致图像细节丢失、色彩饱和度降低和噪点增加。为了减少影响,建议使用较小的羽化半径,复制图层后再羽化,以及仔细对比羽化前后图像质量。此外,羽化并不适用于所有情况,有时蒙版等工具更适合处理图像边缘。

mysql安装后怎么优化数据库性能 mysql安装后怎么优化数据库性能 Apr 08, 2025 am 11:36 AM

MySQL性能优化需从安装配置、索引及查询优化、监控与调优三个方面入手。1.安装后需根据服务器配置调整my.cnf文件,例如innodb_buffer_pool_size参数,并关闭query_cache_size;2.创建合适的索引,避免索引过多,并优化查询语句,例如使用EXPLAIN命令分析执行计划;3.利用MySQL自带监控工具(SHOWPROCESSLIST,SHOWSTATUS)监控数据库运行状况,定期备份和整理数据库。通过这些步骤,持续优化,才能提升MySQL数据库性能。

mySQL下载完安装不了 mySQL下载完安装不了 Apr 08, 2025 am 11:24 AM

MySQL安装失败的原因主要有:1.权限问题,需以管理员身份运行或使用sudo命令;2.依赖项缺失,需安装相关开发包;3.端口冲突,需关闭占用3306端口的程序或修改配置文件;4.安装包损坏,需重新下载并验证完整性;5.环境变量配置错误,需根据操作系统正确配置环境变量。解决这些问题,仔细检查每个步骤,就能顺利安装MySQL。

如何针对高负载应用程序优化 MySQL 性能? 如何针对高负载应用程序优化 MySQL 性能? Apr 08, 2025 pm 06:03 PM

MySQL数据库性能优化指南在资源密集型应用中,MySQL数据库扮演着至关重要的角色,负责管理海量事务。然而,随着应用规模的扩大,数据库性能瓶颈往往成为制约因素。本文将探讨一系列行之有效的MySQL性能优化策略,确保您的应用在高负载下依然保持高效响应。我们将结合实际案例,深入讲解索引、查询优化、数据库设计以及缓存等关键技术。1.数据库架构设计优化合理的数据库架构是MySQL性能优化的基石。以下是一些核心原则:选择合适的数据类型选择最小的、符合需求的数据类型,既能节省存储空间,又能提升数据处理速度

See all articles