벡터화를 사용하여 Python에서 루프 교체
모든 프로그래밍 언어는 루프와 분리될 수 없습니다. 따라서 기본적으로 반복 작업이 있을 때마다 루프 실행을 시작합니다. 그러나 많은 수의 반복(수백만/수십억 행)을 처리할 때 루프를 사용하는 것은 범죄입니다. 몇 시간 동안 정체되어 있다가 나중에 그것이 작동하지 않는다는 것을 깨닫게 될 수도 있습니다. Python에서 벡터화를 구현하는 것이 매우 중요합니다.
벡터화란 무엇인가요?
벡터화는 데이터 세트에 (NumPy) 배열 작업을 구현하는 기술입니다. 뒤에서는 한 번에 한 행씩 작업하는 "for" 루프와는 달리 배열이나 계열의 모든 요소에 작업을 한 번에 적용합니다.
다음으로 벡터화가 무엇인지 보여주기 위해 몇 가지 사용 사례를 사용하겠습니다.
숫자의 합
##使用循环 import time start = time.time() # iterative sum total = 0 # iterating through 1.5 Million numbers for item in range(0, 1500000): total = total + item print('sum is:' + str(total)) end = time.time() print(end - start) #1124999250000 #0.14 Seconds
## 使用矢量化 import numpy as np start = time.time() # vectorized sum - using numpy for vectorization # np.arange create the sequence of numbers from 0 to 1499999 print(np.sum(np.arange(1500000))) end = time.time() print(end - start) ##1124999250000 ##0.008 Seconds
범위 함수를 사용한 반복에 비해 벡터화 실행 시간이 약 18배 단축됩니다. 이 차이는 Pandas DataFrame을 사용할 때 더욱 중요해집니다.
수학 연산
데이터 과학에서 개발자는 Pandas DataFrame으로 작업할 때 루프를 사용하여 수학 연산을 통해 새로운 파생 열을 생성합니다.
아래 예에서 이러한 사용 사례에 대해 루프를 벡터화로 대체하는 것이 얼마나 쉬운지 확인할 수 있습니다.
DataFrame은 행과 열 형태의 표 형식 데이터입니다.
우리는 0에서 50 사이의 임의의 값으로 채워진 500만 개의 행과 4개의 열이 있는 pandas DataFrame을 만듭니다.
import numpy as np import pandas as pd df = pd.DataFrame(np.random.randint( 0 , 50 , size=( 5000000 , 4 )), columns=( 'a' , 'b' , 'c' , 'd ' )) df.shape # (5000000, 5) df.head()
새 열 "ratio"를 만들어 "d" 열과 "c" 열의 비율을 찾습니다.
## 循环遍历 import time start = time.time() # 使用 iterrows 遍历 DataFrame for idx, row in df.iterrows(): # 创建一个新列 df.at[idx, 'ratio' ] = 100 * (row[ "d" ] / row[ "c" ]) end = time.time() print (end - start) ### 109 秒
## 使用矢量化 start = time.time() df[ "ratio" ] = 100 * (df[ "d" ] / df[ "c" ]) end = time.time() print (end - start) ### 0.12 秒
DataFrame을 사용하면 벡터화된 작업이 Python의 루프에 비해 거의 1000배 더 빠르게 향상되어 상당한 개선이 이루어졌습니다.
If-else 문
우리는 "If-else" 유형 논리를 사용해야 하는 많은 작업을 구현했습니다. 이 논리를 Python의 벡터화된 작업으로 쉽게 대체할 수 있습니다.
더 잘 이해하기 위해 다음 예를 살펴보겠습니다(사용 사례 2에서 생성한 DataFrame을 사용합니다).
기존 열 "a" Column "에 대한 일부 조건을 기반으로 새 열을 생성한다고 상상해 보세요. e"
## 使用循环 import time start = time.time() # 使用 iterrows 遍历 DataFrame for idx, row in df.iterrows(): if row.a == 0 : df.at[idx, 'e' ] = row.d elif ( row.a <= 25 ) & (row.a > 0 ): df.at[idx, 'e' ] = (row.b)-(row.c) else : df.at[idx, 'e' ] = row.b + row.c end = time.time() print (end - start) ### 耗时:166 秒
## 矢量化 start = time.time() df[ 'e' ] = df[ 'b' ] + df[ 'c' ] df.loc[df[ 'a' ] <= 25 , 'e' ] = df [ 'b' ] -df[ 'c' ] df.loc[df[ 'a' ]== 0 , 'e' ] = df[ 'd' ]end = time.time() 打印(结束 - 开始) ## 0.29007707595825195 秒
벡터화된 작업은 if-else 문을 사용하는 Python 루프에 비해 600배 더 빠릅니다.
머신 러닝/딥 러닝 네트워크 해결
딥 러닝을 위해서는 수백만, 수십억 줄의 복잡한 방정식과 문제를 해결해야 합니다. Python에서 이러한 방정식을 풀기 위해 루프를 실행하는 것은 매우 느리며 벡터화가 최상의 솔루션입니다.
예를 들어 다음 다중 선형 회귀 방정식에서 수백만 행에 대한 y 값을 계산하려면:
루핑 대신 벡터화를 사용할 수 있습니다.
m1, m2, m3…의 값은 x1, x2, x3…
import numpy as np # 设置 m 的初始值 m = np.random.rand( 1 , 5 ) # 500 万行的输入值 x = np.random.rand( 5000000 , 5 )
## 使用循环 import numpy as np m = np.random.rand(1,5) x = np.random.rand(5000000,5) total = 0 tic = time.process_time() for i in range(0,5000000): total = 0 for j in range(0,5): total = total + x[i][j]*m[0][j] zer[i] = total toc = time.process_time() print ("Computation time = "+ str ((toc - tic)) + "seconds" ) ####计算时间 = 27.02 秒
## 矢量化 tic = time.process_time() #dot product np.dot(x,mT) toc = time.process_time() print ( "计算时间 = " + str ((toc - tic)) + "seconds" ) ####计算时间 = 0.107 秒
np에 해당하는 수백만 개의 값을 사용하여 위 방정식을 풀어 결정됩니다. 백엔드의 벡터화된 행렬 곱셈. Python의 루프에 비해 165배 빠릅니다.
결론
파이썬의 벡터화는 매우 빠르며 매우 큰 데이터 세트를 처리할 때마다 루프보다 선호되어야 합니다.
시간이 지남에 따라 구현을 시작하면 벡터화된 코드 라인을 따라 생각하는 데 익숙해질 것입니다.
위 내용은 벡터화를 사용하여 Python에서 루프 교체의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PyCharm은 개발자가 프로그래밍 효율성을 향상시키는 데 도움이 될 수 있는 풍부한 기능과 단축키를 갖춘 일반적으로 사용되는 Python 통합 개발 환경입니다. 일상적인 프로그래밍 과정에서 PyCharm의 단축키 교체 기술을 익히면 개발자가 작업을 더 빠르게 완료하는 데 도움이 될 수 있습니다. 이 문서에서는 프로그래밍 속도를 쉽게 향상시키는 데 도움이 되도록 PyCharm에서 일반적으로 사용되는 대체 단축키를 소개합니다. 1.Ctrl+R 교체 PyCharm에서는 Ctrl+R 단축키를 사용하여 교체 작업을 수행할 수 있습니다.

jQuery는 웹 개발에 널리 사용되는 클래식 JavaScript 라이브러리로, 이벤트 처리, DOM 요소 조작, 웹 페이지에서 애니메이션 수행과 같은 작업을 단순화합니다. jQuery를 사용할 때 요소의 클래스 이름을 바꿔야 하는 상황이 자주 발생합니다. 이 기사에서는 몇 가지 실용적인 방법과 구체적인 코드 예제를 소개합니다. 1. RemoveClass() 및 addClass() 메소드 사용 jQuery는 삭제를 위한 RemoveClass() 메소드를 제공합니다.

PyCharm은 개발 효율성을 크게 향상시킬 수 있는 풍부한 기능과 도구를 갖춘 강력한 Python 통합 개발 환경입니다. 그 중 교체 기능은 개발 과정에서 자주 사용되는 기능 중 하나로, 개발자가 코드를 빠르게 수정하고 코드 품질을 향상시키는 데 도움을 줄 수 있습니다. 이 기사에서는 초보자가 이 기능을 더 잘 익히고 사용할 수 있도록 특정 코드 예제와 함께 PyCharm의 대체 기능을 자세히 소개합니다. 대체 기능 소개 PyCharm의 대체 기능은 개발자가 코드에서 지정된 텍스트를 빠르게 대체하는 데 도움이 될 수 있습니다.

PyCharm은 프로그래머들 사이에서 인기 있는 통합 개발 환경으로 프로그래밍을 더욱 효율적이고 편리하게 만들어주는 강력한 기능과 도구를 제공합니다. PyCharm에서는 단축키의 합리적인 설정과 교체가 프로그래밍 효율성을 높이는 열쇠 중 하나입니다. 이 기사에서는 프로그래밍을 보다 편리하게 만들기 위해 PyCharm에서 단축키를 대체하는 방법을 소개합니다. 1. 단축키를 대체해야 하는 이유 PyCharm에서 단축키는 프로그래머가 다양한 작업을 빠르게 완료하고 프로그래밍 효율성을 향상시키는 데 도움이 됩니다. 그러나 사람마다 습관이 다르기 때문에 어떤 사람들은 그럴 수도 있습니다.

람다 표현식은 루프에서 벗어나기 때문에 특정 코드 예제가 필요합니다. 프로그래밍에서 루프 구조는 자주 사용되는 중요한 구문입니다. 그러나 특정 상황에서는 현재 루프 반복을 종료하는 대신 루프 본문 내에서 특정 조건이 충족될 때 전체 루프를 중단하고 싶을 수도 있습니다. 이때 람다 표현식의 특징은 루프에서 벗어나는 목표를 달성하는 데 도움이 될 수 있습니다. 람다 표현식은 내부적으로 간단한 함수 논리를 정의할 수 있는 익명 함수를 선언하는 방법입니다. 일반적인 함수 선언과는 다릅니다.

Python에서는 openpyxl이라는 타사 Python 라이브러리를 사용하여 Excel에서 한 단어를 다른 단어로 바꿀 수 있습니다. Microsoft Excel은 데이터를 관리하고 분석하는 데 유용한 도구입니다. Python을 사용하면 일부 Excel 데이터 관리 작업을 자동화할 수 있습니다. 이번 글에서는 Python을 사용하여 Excel에서 단어를 바꾸는 방법을 알아봅니다. Excel에서 Word를 대체하기 위해 openpyxl을 설치하기 전에 Python 패키지 관리자를 사용하여 시스템에 openpyxl 라이브러리를 설치해야 합니다. openpyxl을 설치하려면 터미널이나 명령 프롬프트에 다음 명령을 입력하세요. 피핀스트

PyCharm은 개발자들에게 널리 사랑받고 있는 Python 통합 개발 환경으로, 코드를 빠르게 교체할 수 있는 다양한 방법을 제공하여 개발 프로세스를 더욱 효율적으로 만듭니다. 이 기사에서는 PyCharm에서 코드를 빠르게 대체하기 위해 일반적으로 사용되는 몇 가지 방법을 공개하고 개발자가 이러한 기능을 더 잘 사용할 수 있도록 구체적인 코드 예제를 제공합니다. 1. 교체 기능 사용 PyCharm은 개발자가 코드에서 텍스트를 빠르게 교체하는 데 도움이 되는 강력한 교체 기능을 제공합니다. 단축키 Ctrl+R을 사용하거나 편집기에서 마우스 오른쪽 버튼을 클릭하고 Re를 선택합니다.

이 기사에서는 PHP가 배열의 모든 값을 반환하여 배열을 형성하는 방법을 자세히 설명합니다. 편집자는 이것이 매우 실용적이라고 생각하므로 이 기사를 읽고 뭔가를 얻을 수 있기를 바랍니다. . array_values() 함수 사용하기 array_values() 함수는 배열에 있는 모든 값의 배열을 반환합니다. 원래 배열의 키는 유지되지 않습니다. $array=["foo"=>"bar","baz"=>"qux"];$values=array_values($array);//$values는 ["bar","qux"]를 사용하여 루프는 루프를 사용하여 배열의 모든 값을 수동으로 가져오고 새 값에 추가할 수 있습니다.
