Penyingkiran Tanda Baca Pantas dengan Panda
Penyingkiran tanda baca ialah tugas pembersihan teks biasa. Walaupun panda str.replace ialah kaedah yang digunakan secara meluas, ia mungkin tidak cukup berprestasi untuk set data yang besar.
Alternatif untuk str.replace:
Tanda aras:
Pertimbangan:
Kod:
import pandas as pd import re # Regex.sub df['text'] = [re.compile(r'[^\w\s]+').sub('', x) for x in df['text'].tolist()] # str.translate punct = '!"#$%&\'()*+,-./:;<=>?@[\]^_`{|}~' transtab = str.maketrans(dict.fromkeys(punct, '')) df['text'] = '|'.join(df['text'].tolist()).translate(transtab).split('|')
Atas ialah kandungan terperinci Apakah Cara Terpantas untuk Mengalih Keluar Tanda Baca daripada Pandas DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!