Python은 csv 파일을 읽고 열을 제거한 다음 새 파일을 작성합니다. 기술 튜토리얼-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python은 csv 파일을 읽고 열을 제거한 다음 새 파일을 작성합니다. 기술 튜토리얼

小云云

Dec 30, 2017 pm 01:23 PM

python

이 글은 주로 Python에서 csv 파일을 읽고 열을 제거한 다음 새 파일을 작성하는 예제를 공유합니다. 이는 훌륭한 참조 가치가 있으며 모든 사람에게 도움이 되기를 바랍니다. 에디터를 따라가며 살펴보겠습니다. 모두가 Python을 더 잘 익히는 데 도움이 되기를 바랍니다

저는 이 문제를 해결하기 위해 두 가지 방법을 사용했는데, 둘 다 인터넷에 있는 기존 솔루션입니다.

시나리오 설명:

텍스트 모드로 저장된 데이터 파일이 있습니다. 이제 user_id, plan_id 및 mobile_id라는 세 개의 열이 있습니다. 목표는 mobile_id, plan_id만으로 새 파일을 얻는 것입니다.

솔루션

옵션 1: 파이썬을 사용하여 파일을 열고 쓰고 데이터를 직접 읽고 for 루프에서 데이터를 처리한 후 새 파일에 씁니다.

코드는 다음과 같습니다.

def readwrite1( input_file,output_file):
 f = open(input_file, &#39;r&#39;)
 out = open(output_file,&#39;w&#39;)
 print (f)
 for line in f.readlines():
 a = line.split(",")
 x=a[0] + "," + a[1]+"\n"
 out.writelines(x)
 f.close()
 out.close()

로그인 후 복사

옵션 2: pandas를 사용하여 데이터를 DataFrame으로 읽은 다음 데이터를 분할하고 DataFrame의 쓰기 기능을 사용하여 직접 씁니다. 새 파일

코드는 다음과 같습니다.

def readwrite2(input_file,output_file): date_1=pd.read_csv(input_file,header=0,sep=&#39;,&#39;) date_1[[&#39;mobile&#39;, &#39;plan_id&#39;]].to_csv(output_file, sep=&#39;,&#39;, header=True,index=False)

로그인 후 복사

코드 관점에서 보면 pandas의 논리가 더 명확합니다.

실행 효율성을 살펴보겠습니다!

def getRunTimes( fun ,input_file,output_file):
 begin_time=int(round(time.time() * 1000))
 fun(input_file,output_file)
 end_time=int(round(time.time() * 1000))
 print("读写运行时间：",(end_time-begin_time),"ms")

getRunTimes(readwrite1,input_file,output_file) #直接撸数据
getRunTimes(readwrite2,input_file,output_file1) #使用dataframe读写数据

로그인 후 복사

읽기 및 쓰기 실행 시간: 976 ms

읽기 및 쓰기 실행 시간: 777 ms

input_file에는 약 270,000개의 데이터가 있습니다. 데이터 프레임의 효율성은 여전히 for 루프보다 빠릅니다. 데이터가 클수록 효과가 더 뚜렷해 집니까?

다음으로 input_file 레코드 수를 늘려보세요. 결과는 다음과 같습니다.

input_file	readwrite1	readwrite2
27W	976	777
55W	1989	1509
110W	4312	3158

위의 테스트 결과로 데이터 프레임의 효율성이 향상되었습니다. 약 30% 정도.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7439

Cakephp 튜토리얼

1369

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

Related knowledge

C 언어 합계의 기능은 무엇입니까? Apr 03, 2025 pm 02:21 PM

C 언어에는 내장 합계 기능이 없으므로 직접 작성해야합니다. 합계는 배열 및 축적 요소를 가로 질러 달성 할 수 있습니다. 루프 버전 : 루프 및 배열 길이를 사용하여 계산됩니다. 포인터 버전 : 포인터를 사용하여 배열 요소를 가리키며 효율적인 합계는 자체 증가 포인터를 통해 달성됩니다. 동적으로 배열 버전을 할당 : 배열을 동적으로 할당하고 메모리를 직접 관리하여 메모리 누출을 방지하기 위해 할당 된 메모리가 해제되도록합니다.

누가 더 많은 파이썬이나 자바 스크립트를 지불합니까? Apr 04, 2025 am 12:09 AM

기술 및 산업 요구에 따라 Python 및 JavaScript 개발자에 대한 절대 급여는 없습니다. 1. 파이썬은 데이터 과학 및 기계 학습에서 더 많은 비용을 지불 할 수 있습니다. 2. JavaScript는 프론트 엔드 및 풀 스택 개발에 큰 수요가 있으며 급여도 상당합니다. 3. 영향 요인에는 경험, 지리적 위치, 회사 규모 및 특정 기술이 포함됩니다.

별개의 구별이 관련되어 있습니까? Apr 03, 2025 pm 10:30 PM

구별되고 구별되는 것은 구별과 관련이 있지만, 다르게 사용됩니다. 뚜렷한 (형용사)는 사물 자체의 독창성을 묘사하고 사물 사이의 차이를 강조하는 데 사용됩니다. 뚜렷한 (동사)는 구별 행동이나 능력을 나타내며 차별 과정을 설명하는 데 사용됩니다. 프로그래밍에서 구별은 종종 중복 제거 작업과 같은 컬렉션에서 요소의 독창성을 나타내는 데 사용됩니다. 홀수 및 짝수 숫자를 구별하는 것과 같은 알고리즘이나 함수의 설계에 별개가 반영됩니다. 최적화 할 때 별도의 작업은 적절한 알고리즘 및 데이터 구조를 선택해야하며, 고유 한 작업은 논리 효율성의 구별을 최적화하고 명확하고 읽을 수있는 코드 작성에주의를 기울여야합니다.

이해하는 방법! x는? Apr 03, 2025 pm 02:33 PM

! x 이해! x는 C 언어로 된 논리적 비 운영자입니다. 그것은 x의 값, 즉 실제 변경, 거짓, 잘못된 변경 사항을 부수합니다. 그러나 C의 진실과 거짓은 부울 유형보다는 숫자 값으로 표시되며, 0이 아닌 것은 참으로 간주되며 0만이 거짓으로 간주됩니다. 따라서! x는 음수를 양수와 동일하게 처리하며 사실로 간주됩니다.

C 언어에서 합계는 무엇을 의미합니까? Apr 03, 2025 pm 02:36 PM

합에 대한 C에는 내장 합계 기능이 없지만 다음과 같이 구현할 수 있습니다. 루프를 사용하여 요소를 하나씩 축적합니다. 포인터를 사용하여 요소를 하나씩 액세스하고 축적합니다. 큰 데이터 볼륨의 경우 병렬 계산을 고려하십시오.

H5 페이지 생산에는 지속적인 유지 보수가 필요합니까? Apr 05, 2025 pm 11:27 PM

코드 취약점, 브라우저 호환성, 성능 최적화, 보안 업데이트 및 사용자 경험 개선과 같은 요소로 인해 H5 페이지를 지속적으로 유지해야합니다. 효과적인 유지 관리 방법에는 완전한 테스트 시스템 설정, 버전 제어 도구 사용, 페이지 성능을 정기적으로 모니터링하고 사용자 피드백 수집 및 유지 관리 계획을 수립하는 것이 포함됩니다.

58.com 작업 페이지에서 실시간 응용 프로그램 및 뷰어 데이터를 얻는 방법은 무엇입니까? Apr 05, 2025 am 08:06 AM

크롤링하는 동안 58.com 작업 페이지의 동적 데이터를 얻는 방법은 무엇입니까? Crawler 도구를 사용하여 58.com의 작업 페이지를 크롤링 할 때는이 문제가 발생할 수 있습니다.

사랑 코드 복사 및 붙여 넣기 복사하여 사랑 코드를 무료로 붙여 넣으십시오. Apr 04, 2025 am 06:48 AM

코드 복사 및 붙여 넣기는 불가능하지는 않지만주의해서 처리해야합니다. 코드의 환경, 라이브러리, 버전 등과 같은 종속성은 현재 프로젝트와 일치하지 않으므로 오류 또는 예측할 수없는 결과를 초래할 수 있습니다. 파일 경로, 종속 라이브러리 및 Python 버전을 포함하여 컨텍스트가 일관되게 유지하십시오. 또한 특정 라이브러리의 코드를 복사 및 붙여 넣을 때 라이브러리 및 해당 종속성을 설치해야 할 수도 있습니다. 일반적인 오류에는 경로 오류, 버전 충돌 및 일관되지 않은 코드 스타일이 포함됩니다. 성능 최적화는 코드의 원래 목적 및 제약에 따라 재 설계 또는 리팩토링되어야합니다. 복사 코드를 이해하고 디버그하고 맹목적으로 복사하여 붙여 넣지 않는 것이 중요합니다.

See all articles

Python은 csv 파일을 읽고 열을 제거한 다음 새 파일을 작성합니다. 기술 튜토리얼

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제