如何使用 Pandas.cut 和 NumPy.searchsorted 有效地对 Pandas 列进行分类？-Python教程-PHP中文网

对 Pandas 列进行分箱

Pandas.cut 方法

NumPy.searchsorted 方法

计算值计数

首页

后端开发

Python教程

如何使用 Pandas.cut 和 NumPy.searchsorted 有效地对 Pandas 列进行分类？

Barbara Streisand

Dec 09, 2024 am 11:17 AM

How Can I Effectively Bin a Pandas Column Using Pandas.cut and NumPy.searchsorted?

对 Pandas 列进行分箱

分箱涉及将连续数据列划分为离散间隔以分析数据分布。要使用 Pandas 对数值列进行分箱，我们可以探索各种方法。

Pandas.cut 方法

Pandas 提供了 cut 函数来执行分箱。它将要分箱的系列和分箱边缘列表作为参数。默认情况下，它返回带有 bin 标签的分类列。例如：

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)

登录后复制

NumPy.searchsorted 方法

NumPy 的 searchsorted 函数也可以用于分箱。它返回系列中每个值所属的 bin 的索引。然后，结果值可用于创建分箱类别：

df['binned'] = np.searchsorted(bins, df['percentage'].values)

登录后复制

计算值计数

创建分箱列后，我们可以计算值计数以确定观测值的数量每个垃圾箱。这可以使用 value_counts 或 groupby 以及聚合大小来实现：

s = pd.cut(df['percentage'], bins=bins).value_counts()

登录后复制

s = df.groupby(pd.cut(df['percentage'], bins=bins)).size()

登录后复制

通过使用这些技术，我们可以有效地对 Pandas 中的数字数据列进行分类，以深入了解它们的分布。

以上是如何使用 Pandas.cut 和 NumPy.searchsorted 有效地对 Pandas 列进行分类？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1667

CakePHP 教程

1426

Laravel 教程

1328

PHP教程

1273

C# 教程

1255

显示更多

Related knowledge

Python：游戏，Guis等 Apr 13, 2025 am 12:14 AM

Python在游戏和GUI开发中表现出色。1)游戏开发使用Pygame，提供绘图、音频等功能，适合创建2D游戏。2)GUI开发可选择Tkinter或PyQt，Tkinter简单易用，PyQt功能丰富，适合专业开发。

Python与C：学习曲线和易用性 Apr 19, 2025 am 12:20 AM

Python更易学且易用，C 则更强大但复杂。1.Python语法简洁，适合初学者，动态类型和自动内存管理使其易用，但可能导致运行时错误。2.C 提供低级控制和高级特性，适合高性能应用，但学习门槛高，需手动管理内存和类型安全。

Python和时间：充分利用您的学习时间 Apr 14, 2025 am 12:02 AM

要在有限的时间内最大化学习Python的效率，可以使用Python的datetime、time和schedule模块。1.datetime模块用于记录和规划学习时间。2.time模块帮助设置学习和休息时间。3.schedule模块自动化安排每周学习任务。

Python vs.C：探索性能和效率 Apr 18, 2025 am 12:20 AM

Python在开发效率上优于C ，但C 在执行性能上更高。1.Python的简洁语法和丰富库提高开发效率。2.C 的编译型特性和硬件控制提升执行性能。选择时需根据项目需求权衡开发速度与执行效率。

Python标准库的哪一部分是：列表或数组？ Apr 27, 2025 am 12:03 AM

pythonlistsarepartofthestAndArdLibrary，herilearRaysarenot.listsarebuilt-In，多功能，和Rused ForStoringCollections，而EasaraySaraySaraySaraysaraySaraySaraysaraySaraysarrayModuleandleandleandlesscommonlyusedDduetolimitedFunctionalityFunctionalityFunctionality。