pandas は重複テーブルの重複排除を実装し、それらをテーブルに再変換します

不言
リリース: 2018-04-18 15:47:28
オリジナル
2982 人が閲覧しました

次の記事では、重複したテーブルを削除して再度テーブルに変換するパンダのメソッドを紹介します。これは非常に参考になるので、皆さんのお役に立てれば幸いです。一緒に見に来てください

Pythonがデータを処理する際には、DataFrameとsetがよく使われます。

train=pd.read_csv('XXX.csv')#读取文件 
train=train['item_id']#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame 
data.to_csv('xxx.csv',index=False)#保存表格
ログイン後にコピー

パンダをインポートするのを忘れないでください~

以上がpandas は重複テーブルの重複排除を実装し、それらをテーブルに再変換しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート