概述:
在 Pandas 中,groupby() 方法提供了两个选项来操作按特定列分组的数据:应用()和变换()。这些方法在输入、输出和行为方面有所不同。
键差异:
功能 | 应用 | 变换 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
传递包含每个组的所有列的 DataFrame | 传递每个组中每一列的单独系列group | ||||||||||||
输出: | 可以返回标量、Series、DataFrames或其他对象 | 必须返回与长度相同的序列(系列、数组或列表) group | ||||||||||||
行为: |
对每个组内的整个 DataFrame 进行操作 | 对单个列进行操作一次 |
当您需要将自定义函数应用于每个组内的整个 DataFrame 时。这允许复杂的逐行处理并返回具有相同值的 DataFrame行数为输入。
df.groupby('State').apply(lambda x: pd.DataFrame({'Average': x.mean()}))
示例:
当您需要在每个列中逐列应用自定义函数这允许您操作特定列而不影响整个 DataFrame。
df.groupby('State').transform(lambda x: x - x.mean())
示例:
以上是应用与转换:什么时候应该在 Pandas Groupby 中使用 Which?的详细内容。更多信息请关注PHP中文网其他相关文章!