この記事では、pandas で DataFrame の列名を変更する方法 (コード例) を紹介します。一定の参考値があります。困っている友人は参考にしてください。お役に立てれば幸いです。
この記事の参照元: pandas DataFrame の列名の変更
元のブログでは、DataFrame.columns の各要素に対して同じ変更操作を行っています。
しかし、私の地味な作業は、異なる操作を行う機械的なコピーです。
#質問する
dataset>>> dataset.columns Index(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan', 'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays', 'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx', 'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'], dtype='object')
columns名前が次のように変更されました:
>>> new_columns Index(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5', 'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10', 'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14', 'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17', 'euribor3m_18', 'nr.employed_19', 'y_20'], dtype='object')
操作方法? #解決策
1. DataFrame.columns クラスの独自のプロパティを通じて変更します:
1. 脳の割り当てを必要としない直接変更>>> # 先解决`new_columns`的推导问题 >>> # 列表推导 >>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)] >>> # 类型转换 >>> new_columns = pd.core.indexes.base.Index(new_columns_list) >>> dataset.columns = new_columns
>>> # 注:mapper 多运用 lambda 表达式 >>> # 但我似乎没有找到在 lambda 表达式中改变两个值的方法 >>> # 所以只能蹩脚地用一个全局变量i, 和映射函数mapper() >>> # 希望大家能帮我找到方法 >>> i = 0 >>> def mapper(x): # 映射函数即 mapper global i x += '_' + str(i) i += 1 return x >>> dataset.columns.map(mapper)
usedドキュメントを検索しましたが、できませんでした。使用できるものが見つかりません。メソッドを適用しています。時間をかけてこのドキュメントを翻訳したいと思います
#2。DataFrame.rename() 関数を使用して変更します
#1. 暴力的な辞書方式 (利点: 特定の列のみを変更できる)>>> # 此处先用字典推导法
>>> new_dict = {
key:key+'_'+str(i)
for i, key in enumerate(dataset.columns)
}
>>> dataset.rename(columns=new_dict, inplace=True)
>>> # 原博文依然用到了 lambda 表达式 >>> # 我就再生搬硬套一次, 把上面的复制过来 >>> # 蹩脚地用一个全局变量i, 和映射函数mapper() >>> i = 0 >>> def mapper(x): # 映射函数即 mapper global i x += '_' + str(i) i += 1 return x dataset.rename(columns=mapper, inplace=True)
以上がpandasでDataFrameの列名を変更する方法の紹介(コード例)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。