如何有效地对 Pandas 列进行分箱并对每个分箱中的值进行计数？-Python教程-PHP中文网

将列与 Pandas 合并

首页

后端开发

Python教程

如何有效地对 Pandas 列进行分箱并对每个分箱中的值进行计数？

Susan Sarandon

Dec 09, 2024 pm 07:17 PM

How to Efficiently Bin a Pandas Column and Count Values in Each Bin?

将列与 Pandas 合并

在数据分析中，将数据分入类别以简化其表示和分析通常很有用。这是处理数字数据时的常用技术，例如处理百分比时。

假设我们有一个名为“percentage”的数据框列，其中包含数值，如下所示：

df['percentage'].head()
46.5
44.2
100.0
42.12

登录后复制

要对此列进行分箱并获取每个分箱的值计数，我们可以使用 pd.cut 函数。有两种方法可以实现此目的：

将 pd.cut 与 value_counts 结合使用：

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
print(df.groupby(df['binned']).size())

登录后复制

使用 np.searchsorted 和 groupby：

df['binned'] = np.searchsorted(bins, df['percentage'].values)
print(df.groupby(df['binned']).size())

登录后复制

两种方法都会返回以下内容输出：

percentage
(0, 1]       0
(1, 5]       0
(5, 10]      0
(10, 25]     0
(25, 50]     3
(50, 100]    1
dtype: int64

登录后复制

此输出表示 bin (0, 1]、(1, 5]、(5, 10] 和 (10, 25]) 中没有值。三个值落入在 bin (25, 50] 中，并且有一个值落在 bin (50, 100] 中。

以上是如何有效地对 Pandas 列进行分箱并对每个分箱中的值进行计数？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

Java教程

1672

CakePHP 教程

1428

Laravel 教程

1332

PHP教程

1276

C# 教程

1256

显示更多

Related knowledge

Python与C：学习曲线和易用性 Apr 19, 2025 am 12:20 AM

Python更易学且易用，C 则更强大但复杂。1.Python语法简洁，适合初学者，动态类型和自动内存管理使其易用，但可能导致运行时错误。2.C 提供低级控制和高级特性，适合高性能应用，但学习门槛高，需手动管理内存和类型安全。

Python和时间：充分利用您的学习时间 Apr 14, 2025 am 12:02 AM

要在有限的时间内最大化学习Python的效率，可以使用Python的datetime、time和schedule模块。1.datetime模块用于记录和规划学习时间。2.time模块帮助设置学习和休息时间。3.schedule模块自动化安排每周学习任务。

Python vs.C：探索性能和效率 Apr 18, 2025 am 12:20 AM

Python在开发效率上优于C ，但C 在执行性能上更高。1.Python的简洁语法和丰富库提高开发效率。2.C 的编译型特性和硬件控制提升执行性能。选择时需根据项目需求权衡开发速度与执行效率。

学习Python：2小时的每日学习是否足够？ Apr 18, 2025 am 12:22 AM

每天学习Python两个小时是否足够？这取决于你的目标和学习方法。1)制定清晰的学习计划，2)选择合适的学习资源和方法，3)动手实践和复习巩固，可以在这段时间内逐步掌握Python的基本知识和高级功能。

Python vs. C：了解关键差异 Apr 21, 2025 am 12:18 AM

Python和C 各有优势，选择应基于项目需求。1)Python适合快速开发和数据处理，因其简洁语法和动态类型。2)C 适用于高性能和系统编程，因其静态类型和手动内存管理。

Python标准库的哪一部分是：列表或数组？ Apr 27, 2025 am 12:03 AM

pythonlistsarepartofthestAndArdLibrary，herilearRaysarenot.listsarebuilt-In，多功能，和Rused ForStoringCollections，而EasaraySaraySaraySaraysaraySaraySaraysaraySaraysarrayModuleandleandleandlesscommonlyusedDduetolimitedFunctionalityFunctionalityFunctionality。