Python 데이터 처리 팬더에서 읽기 및 쓰기 작업을 위한 IO 도구로 CSV 사용-파이썬 튜토리얼-php.cn

pandas의 IO API는 최상위 reader세트입니다. > 함수. 예를 들어 pandas.read_csv()는 pandas 객체를 반환합니다. pandas 的 IO API 是一组顶层的 reader 函数，比如 pandas.read_csv()，会返回一个 pandas 对象。

而相应的 writer 函数是对象方法，如 DataFrame.to_csv()。

注意：后面会用到 StringIO，请确保导入

# python3
from io import StringIO
# python2
from StringIO import StringIO

로그인 후 복사

1 CSV 和文本文件

读取文本文件的主要函数是 read_csv()

1 参数解析

read_csv() 接受以下常用参数:

1.1 基础

filepath_or_buffer: 变量

可以是文件路径、文件 URL 或任何带有 read() 函数的对象

sep: str，默认 ,，对于 read_table 是 t

文件分隔符，如果设置为 None，则 C 引擎无法自动检测分隔符，而 Python 引擎可以通过内置的嗅探器工具自动检测分隔符。
此外，如果设置的字符长度大于 1，且不是 's+'，那么该字符串会被解析为正则表达式，且强制使用 Python 解析引擎。
例如 '\r\t'，但是正则表达式容易忽略文本中的引用数据。

delimiter: str, 默认为 None

sep 的替代参数，功能一致

1.2 列、索引、名称

header: int 或 list, 默认为 'infer'

用作列名的行号，默认行为是对列名进行推断：

如果未指定 names 参数其行为类似于 header=0，即从读取的第一行开始推断。
如果设置了 names，则行为与 header=None 相同。

也可以为 header 设置列表，表示多级列名。如 [0,1,3]，未指定的行（这里是 2）将会被跳过，如果 skip_blank_lines=True，则会跳过空行和注释的行。因此 header=0 并不是代表文件的第一行

names: array-like, 默认为 None

需要设置的列名列表，如果文件中不包含标题行，则应显式传递 header=None，且此列表中不允许有重复值。

index_col: int, str, sequence of int/str, False, 默认为 None

用作 DataFrame 的索引的列，可以字符串名称或列索引的形式给出。如果指定了列表，则使用 MultiIndex
注意：index_col=False 可用于强制 pandas 不要将第一列用作索引。例如，当您的文件是每行末尾都带有一个分隔符的错误文件时。

usecols: 列表或函数, 默认为 None

只读取指定的列。如果是列表，则所有元素都必须是位置（即文件列中的整数索引）或字符串，这些字符串必须与 names 参数提供的或从文档标题行推断出的列名相对应。
列表中的顺序会被忽略，即 usecols=[0, 1] 等价于 [1, 0]
如果是可调用函数，将会根据列名计算，返回可调用函数计算为 True 的名称

In [1]: import pandas as pd
In [2]: from io import StringIO
In [3]: data = "col1,col2,col3\na,b,1\na,b,2\nc,d,3"
In [4]: pd.read_csv(StringIO(data))
Out[4]: 
  col1 col2  col3
0    a    b     1
1    a    b     2
2    c    d     3
In [5]: pd.read_csv(StringIO(data), usecols=lambda x: x.upper() in ["COL1", "COL3"])
Out[5]: 
  col1  col3
0    a     1
1    a     2
2    c     3

로그인 후 복사

使用此参数可以大大加快解析时间并降低内存使用

squeeze: boolean, 默认为 False

如果解析的数据只包含一列，那么返回一个 Series

prefix: str, 默认为 None

当没有标题时，添加到自动生成的列号的前缀，例如 'X' 表示 X0, X1...

mangle_dupe_cols: boolean, 默认为 True

해당 writer 함수는 DataFrame.to_csv()와 같은 객체 메서드입니다. 🎜🎜참고: StringIO는 나중에 사용됩니다. 🎜

In [6]: data = "col1,col2,col3\na,b,1\na,b,2\nc,d,3"
In [7]: pd.read_csv(StringIO(data))
Out[7]: 
  col1 col2  col3
0    a    b     1
1    a    b     2
2    c    d     3
In [8]: pd.read_csv(StringIO(data), skiprows=lambda x: x % 2 != 0)
Out[8]: 
  col1 col2  col3
0    a    b     2

로그인 후 복사

🎜1개의 CSV 및 텍스트 파일을 가져와야 합니다. 🎜🎜텍스트 파일을 읽는 주요 기능은 read_csv()입니다. 🎜< h4>1 매개변수 분석🎜read_csv()는 다음과 같은 공통 매개변수를 허용합니다.🎜

1.1 기본

🎜filepath_or_buffer: 변수🎜

🎜파일 경로, 파일 URL 또는 read() 함수가 있는 모든 개체가 될 수 있습니다🎜🎜 🎜sep: str, 기본값 ,, read_table의 경우 t</code >🎜<ul class=" list-paddingleft-2"><li>🎜파일 구분 기호, <code>None으로 설정하면 C 엔진이 자동으로 구분 기호를 감지할 수 없습니다. Python 엔진은 내장된 스니퍼 도구를 통해 구분 기호를 자동으로 감지할 수 있습니다. 🎜
🎜또한 설정된 문자 길이가 1보다 크고 's+'가 아닌 경우 문자열은 다음과 같이 구문 분석됩니다. 정규 표현식 및 Python 구문 분석 엔진이 강제로 사용됩니다. 🎜
🎜예를 들어 '\r\t'이지만 정규 표현식은 텍스트의 참조 데이터를 무시하는 경향이 있습니다. 🎜

구분 기호

str

None

🎜sep 대체 매개변수, 함수는 동일🎜

1.2 열, 인덱스, 이름

헤더

int< /code> 또는 <code>list

'infer'

🎜행 번호는 다음과 같이 사용됩니다. 열 이름, 기본 동작은 열 이름을 유추하는 것입니다: 🎜

🎜 names 매개변수가 지정되지 않으면 다음과 같이 작동합니다. header =0처럼 읽은 첫 번째 줄부터 시작한다는 의미입니다. 🎜
🎜 names가 설정된 경우 동작은 header=None과 동일합니다. 🎜
🎜다단계 열 이름을 나타내기 위해 헤더 목록을 설정할 수도 있습니다. 예를 들어 [0,1,3], 지정되지 않은 줄(여기서는 2)이 skip_blank_lines=True인 경우 빈 줄과 주석이 달린 줄은 건너뜁니다. 따라서 header=0는 파일🎜

이름

배열과 유사

None

🎜설정해야 하는 열 이름 목록입니다. 파일에 헤더 행이 포함되어 있지 않으면 header =None<은 명시적으로 /code>로 전달되어야 하며, 이 목록에는 중복된 값이 허용되지 않습니다. 🎜</li>🎜🎜<code>index_col: int, str, int/str 시퀀스, False, 기본값은 None🎜
- 🎜DataFrame의 인덱스로 사용되는 열, 문자열 이름이나 열 인덱스로 제공되는 문자일 수 있습니다. 목록이 지정된 경우 MultiIndex🎜
- 🎜를 사용하세요. 참고: index_col=False를 사용하면 pandas가 목록을 지정하지 않도록 강제할 수 있습니다. to One 열이 인덱스로 사용됩니다. 예를 들어 파일이 각 줄 끝에 구분 기호가 있는 잘못된 파일인 경우입니다. 🎜

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

뜨거운 주제

자바 튜토리얼

1677

Cakephp 튜토리얼

1431

라라벨 튜토리얼

1334

PHP 튜토리얼

1280

C# 튜토리얼

1257

Related knowledge

PHP와 Python : 다른 패러다임이 설명되었습니다 Apr 18, 2025 am 12:26 AM

PHP는 주로 절차 적 프로그래밍이지만 객체 지향 프로그래밍 (OOP)도 지원합니다. Python은 OOP, 기능 및 절차 프로그래밍을 포함한 다양한 패러다임을 지원합니다. PHP는 웹 개발에 적합하며 Python은 데이터 분석 및 기계 학습과 같은 다양한 응용 프로그램에 적합합니다.

PHP와 Python 중에서 선택 : 가이드 Apr 18, 2025 am 12:24 AM

PHP는 웹 개발 및 빠른 프로토 타이핑에 적합하며 Python은 데이터 과학 및 기계 학습에 적합합니다. 1.PHP는 간단한 구문과 함께 동적 웹 개발에 사용되며 빠른 개발에 적합합니다. 2. Python은 간결한 구문을 가지고 있으며 여러 분야에 적합하며 강력한 라이브러리 생태계가 있습니다.

PHP와 Python : 그들의 역사에 깊은 다이빙 Apr 18, 2025 am 12:25 AM

PHP는 1994 년에 시작되었으며 Rasmuslerdorf에 의해 개발되었습니다. 원래 웹 사이트 방문자를 추적하는 데 사용되었으며 점차 서버 측 스크립팅 언어로 진화했으며 웹 개발에 널리 사용되었습니다. Python은 1980 년대 후반 Guidovan Rossum에 의해 개발되었으며 1991 년에 처음 출시되었습니다. 코드 가독성과 단순성을 강조하며 과학 컴퓨팅, 데이터 분석 및 기타 분야에 적합합니다.

Golang vs. Python : 성능 및 확장 성 Apr 19, 2025 am 12:18 AM

Golang은 성능과 확장 성 측면에서 Python보다 낫습니다. 1) Golang의 컴파일 유형 특성과 효율적인 동시성 모델은 높은 동시성 시나리오에서 잘 수행합니다. 2) 해석 된 언어로서 파이썬은 천천히 실행되지만 Cython과 같은 도구를 통해 성능을 최적화 할 수 있습니다.

Golang vs. Python : 주요 차이점과 유사성 Apr 17, 2025 am 12:15 AM

Golang과 Python은 각각 고유 한 장점이 있습니다. Golang은 고성능 및 동시 프로그래밍에 적합하지만 Python은 데이터 과학 및 웹 개발에 적합합니다. Golang은 동시성 모델과 효율적인 성능으로 유명하며 Python은 간결한 구문 및 풍부한 라이브러리 생태계로 유명합니다.

Python vs. C : 학습 곡선 및 사용 편의성 Apr 19, 2025 am 12:20 AM

Python은 배우고 사용하기 쉽고 C는 더 강력하지만 복잡합니다. 1. Python Syntax는 간결하며 초보자에게 적합합니다. 동적 타이핑 및 자동 메모리 관리를 사용하면 사용하기 쉽지만 런타임 오류가 발생할 수 있습니다. 2.C는 고성능 응용 프로그램에 적합한 저수준 제어 및 고급 기능을 제공하지만 학습 임계 값이 높고 수동 메모리 및 유형 안전 관리가 필요합니다.

Python vs. C : 성능과 효율성 탐색 Apr 18, 2025 am 12:20 AM

Python은 개발 효율에서 C보다 낫지 만 C는 실행 성능이 높습니다. 1. Python의 간결한 구문 및 풍부한 라이브러리는 개발 효율성을 향상시킵니다. 2.C의 컴파일 유형 특성 및 하드웨어 제어는 실행 성능을 향상시킵니다. 선택할 때는 프로젝트 요구에 따라 개발 속도 및 실행 효율성을 평가해야합니다.

Python vs. JavaScript : 개발 환경 및 도구 Apr 26, 2025 am 12:09 AM

개발 환경에서 Python과 JavaScript의 선택이 모두 중요합니다. 1) Python의 개발 환경에는 Pycharm, Jupyternotebook 및 Anaconda가 포함되어 있으며 데이터 과학 및 빠른 프로토 타이핑에 적합합니다. 2) JavaScript의 개발 환경에는 Node.js, VScode 및 Webpack이 포함되어 있으며 프론트 엔드 및 백엔드 개발에 적합합니다. 프로젝트 요구에 따라 올바른 도구를 선택하면 개발 효율성과 프로젝트 성공률이 향상 될 수 있습니다.

See all articles

Python 데이터 처리 팬더에서 읽기 및 쓰기 작업을 위한 IO 도구로 CSV 사용

Preface

1 CSV 和文本文件

1 参数解析

1.1 基础

1.2 列、索引、名称

1.1 기본

1.2 열, 인덱스, 이름

1.3 常规解析配置

1.4 NA 和缺失数据处理

1.5 日期时间处理

1.6 迭代

1.7 引用、压缩和文件格式

1.8 错误处理

2. 指定数据列的类型

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제