Gemeinschaft

Lernen

Tools-Bibliothek

KI-Tools

Freizeit

Deutsch

Heim > Backend-Entwicklung > Python-Tutorial > Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

不言

Freigeben： 2018-04-18 15:47:28

Original

3127 Leute haben es durchsucht

Das Folgende ist eine Pandas-Methode zum Deduplizieren und erneuten Konvertieren doppelter Tabellen. Sie hat einen guten Referenzwert und ich hoffe, dass sie für alle hilfreich ist. Schauen Sie sich das gemeinsam an

Wenn Python Daten verarbeitet, werden häufig DataFrame und Set verwendet.

train=pd.read_csv(&#39;XXX.csv&#39;)#读取文件 
train=train[&#39;item_id&#39;]#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=[&#39;item_id&#39;])#因为set是无序的，必须要经过list处理后才能成为DataFrame 
data.to_csv(&#39;xxx.csv&#39;,index=False)#保存表格

Nach dem Login kopieren

Denken Sie daran, Pandas zu importieren~

Das obige ist der detaillierte Inhalt vonPandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten：

pandas 表格

Vorheriger Artikel：Schreiben Sie einen einfachen Webcrawler in Python, um Videos aufzunehmen Nächster Artikel：Python-Greed-Matching und Multi-Line-Matching

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors