> 백엔드 개발 > 파이썬 튜토리얼 > Python이 텍스트의 데이터를 읽고 이를 DataFrame_python으로 변환하는 예

Python이 텍스트의 데이터를 읽고 이를 DataFrame_python으로 변환하는 예

不言
풀어 주다: 2018-04-10 15:26:42
원래의
5176명이 탐색했습니다.

이 기사에서는 Python이 텍스트의 데이터를 읽고 이를 DataFrame으로 변환하는 예를 공유합니다. 이는 특정 참조 값을 가지고 있으며 도움이 필요한 사람들에게 도움이 되기를 바랍니다.

기술 Q&A에서 그런 질문을 보고 느꼈습니다. 비교적 흔한 일이니 그냥 별도의 글로 적어보세요.

일반 텍스트 형식 파일 "file_in"에서 데이터를 읽습니다. 형식은 다음과 같습니다.

은 "file_out"으로 출력해야 하며 형식은 다음과 같습니다.

데이터의 원래 형식은 "카테고리: 내용"이며, 하위 항목으로 빈 줄 "n"이 포함되어 있으며, 변환 후에는 한 줄에 한 항목이 되며, 내용은 카테고리에 따라 순서대로 작성됩니다. .

읽은 후 데이터에서 DataFrame이라는 테이블을 생성하려면 pandas를 사용하는 것이 좋습니다. 이렇게 하면 나중에 데이터를 더 쉽게 처리할 수 있습니다. 하지만 원래 형식은 일반적인 테이블 형식이 아니므로 먼저 몇 가지 간단한 처리가 필요합니다.

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)
로그인 후 복사

관련 권장 사항:

Python은 단어로 텍스트 내용을 읽습니다.

3가지 방법에 대한 자세한 설명 및 Python 읽기 파일 내용의 효율성 비교


위 내용은 Python이 텍스트의 데이터를 읽고 이를 DataFrame_python으로 변환하는 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿