import csv,re
with open('xxx.csv','rb') as rf:
reader = csv.reader(rf)
with open('xxx_new.csv','wb') as wf:
writer = csv.writer(wf)
headers = reader.next()
writer.writerow(headers)
for row in reader:
t = re.split('\W+',row[1])
# row[1]为Date字段,被拆为['1', '11', '2016', '14', '17']
if int(t[1]) == 11: # 假设你想要11月数据
writer.writerow(row)
Vous avez dit séries temporelles, avez-vous utilisé des pandas ? S'il s'agit de pandas, c'est en fait assez simple. Supposons que le nom de datefrmae soit df Assurez-vous d'abord que la colonne Date est convertie en DatetimeIndex. Cela peut être fait avec df['newdate']=pd.DatetimeIndex(df['date']) Ensuite. filter df[df ['newdate'].dt.month==9] peut filtrer toutes les données de septembre,
Divisez le champ Date à l'aide de re.split
Vous avez dit séries temporelles, avez-vous utilisé des pandas ?
S'il s'agit de pandas, c'est en fait assez simple. Supposons que le nom de datefrmae soit df
Assurez-vous d'abord que la colonne Date est convertie en DatetimeIndex. Cela peut être fait avec df['newdate']=pd.DatetimeIndex(df['date'])
Ensuite. filter df[df ['newdate'].dt.month==9] peut filtrer toutes les données de septembre,