이 기사에서는 Python이 텍스트의 데이터를 읽고 이를 DataFrame으로 변환하는 예를 공유합니다. 이는 특정 참조 값을 가지고 있으며 도움이 필요한 사람들에게 도움이 되기를 바랍니다.
기술 Q&A에서 그런 질문을 보고 느꼈습니다. 비교적 흔한 일이니 그냥 별도의 글로 적어보세요.
일반 텍스트 형식 파일 "file_in"에서 데이터를 읽습니다. 형식은 다음과 같습니다.
은 "file_out"으로 출력해야 하며 형식은 다음과 같습니다.
데이터의 원래 형식은 "카테고리: 내용"이며, 하위 항목으로 빈 줄 "n"이 포함되어 있으며, 변환 후에는 한 줄에 한 항목이 되며, 내용은 카테고리에 따라 순서대로 작성됩니다. .
읽은 후 데이터에서 DataFrame이라는 테이블을 생성하려면 pandas를 사용하는 것이 좋습니다. 이렇게 하면 나중에 데이터를 더 쉽게 처리할 수 있습니다. 하지만 원래 형식은 일반적인 테이블 형식이 아니므로 먼저 몇 가지 간단한 처리가 필요합니다.
#coding:utf8 import sys from pandas import DataFrame #DataFrame通常来装二维的表格 import pandas as pd #pandas是流行的做数据分析的包 #建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim…… dict_data={} #打开文件 with open('file_in.txt','r')as df: #读每一行 for line in df: #如果这行是换行符就跳过,这里用'\n'的长度来找空行 if line.count('\n') == len(line): continue #对每行清除前后空格(如果有的话),然后用":"分割 for kv in [line.strip().split(':')]: #按照键,把值写进去 dict_data.setdefault(kv[0],[]).append(kv[1]) #print(dict_data)看看效果 #这是把键读出来成为一个列表 columnsname=list(dict_data.keys()) #建立一个DataFrame,列名即为键名,也就是nam,age…… frame = DataFrame(dict_data,columns=columnsname) #把DataFrame输出到一个表,不要行名字和列名字 frame.to_csv('file_out0.txt',index=False,header=False)
관련 권장 사항:
3가지 방법에 대한 자세한 설명 및 Python 읽기 파일 내용의 효율성 비교
위 내용은 Python이 텍스트의 데이터를 읽고 이를 DataFrame_python으로 변환하는 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!