Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

不言
Freigeben: 2018-04-18 15:47:28
Original
2977 Leute haben es durchsucht

Das Folgende ist eine Pandas-Methode zum Deduplizieren und erneuten Konvertieren doppelter Tabellen. Sie hat einen guten Referenzwert und ich hoffe, dass sie für alle hilfreich ist. Schauen Sie sich das gemeinsam an

Wenn Python Daten verarbeitet, werden häufig DataFrame und Set verwendet.

train=pd.read_csv('XXX.csv')#读取文件 
train=train['item_id']#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame 
data.to_csv('xxx.csv',index=False)#保存表格
Nach dem Login kopieren

Denken Sie daran, Pandas zu importieren~

Das obige ist der detaillierte Inhalt vonPandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage