NumPy 배열(2. 배열 연산)
기본 연산
배열 연산은 요소별로 수행됩니다. 배열 작업은 작업 결과를 포함하는 새 배열을 만듭니다.
>>> a= np.array([20,30,40,50]) >>> b= np.arange( 4) >>> b array([0, 1, 2, 3]) >>> c= a-b >>> c array([20, 29, 38, 47]) >>> b**2 array([0, 1, 4, 9]) >>> 10*np.sin(a) array([ 9.12945251,-9.88031624, 7.4511316, -2.62374854]) >>> a<35 array([True, True, False, False], dtype=bool)
다른 행렬 언어와 달리 NumPy의 곱셈 연산자*는 요소별로 계산됩니다. 행렬 곱셈은 도트 함수를 사용하거나 행렬 객체를 생성하여 구현할 수 있습니다. (다음 장에서 소개합니다)
>>> A= np.array([[1,1], ...[0,1]]) >>> B= np.array([[2,0], ...[3,4]]) >>> A*B # 逐个元素相乘 array([[2, 0], [0, 4]]) >>> np.dot(A,B) # 矩阵相乘 array([[5, 4], [3, 4]])
+= 및 *=와 같은 일부 연산자는 새 배열을 생성하지 않고 기존 배열을 수정하는 데 사용됩니다.
>>> a= np.ones((2,3), dtype=int) >>> b= np.random.random((2,3)) >>> a*= 3 >>> a array([[3, 3, 3], [3, 3, 3]]) >>> b+= a >>> b array([[ 3.69092703, 3.8324276, 3.0114541], [ 3.18679111, 3.3039349, 3.37600289]]) >>> a+= b # b转换为整数类型 >>> a array([[6, 6, 6], [6, 6, 6]])
배열이 다른 유형의 요소를 저장할 때 배열은 더 많은 비트를 차지하는 데이터 유형을 자체 데이터 유형으로 사용합니다. 정확한 데이터 유형(이 동작을 업캐스트라고 함)
>>> a= np.ones(3, dtype=np.int32) >>> b= np.linspace(0,np.pi,3) >>> b.dtype.name 'float64' >>> c= a+b >>> c array([ 1., 2.57079633, 4.14159265]) >>> c.dtype.name 'float64' >>> d= exp(c*1j) >>> d array([ 0.54030231+0.84147098j,-0.84147098+0.54030231j, -0.54030231-0.84147098j]) >>> d.dtype.name 'complex128'
배열의 모든 요소의 합을 계산하는 등 배열이 아닌 많은 작업은 ndarray 클래스의 메서드로 구현됩니다. ndarray 클래스의 인스턴스가 필요합니다.
>>> a= np.random.random((2,3)) >>> a array([[ 0.65806048, 0.58216761, 0.59986935], [ 0.6004008, 0.41965453, 0.71487337]]) >>> a.sum() 3.5750261436902333 >>> a.min() 0.41965453489104032 >>> a.max() 0.71487337095581649
이러한 작업은 배열을 1차원 선형 목록으로 처리합니다. 그러나 축 매개변수(즉, 배열의 행)를 지정하여 지정된 축에서 해당 작업을 수행할 수 있습니다.
>>> b= np.arange(12).reshape(3,4) >>> b array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) >>> b.sum(axis=0) # 计算每一列的和,注意理解轴的含义,参考数组的第一篇文章 array([12, 15, 18, 21]) >>> b.min(axis=1) # 获取每一行的最小值 array([0, 4, 8]) >>> b.cumsum(axis=1) # 计算每一行的累积和 array([[ 0, 1, 3, 6], [ 4, 9, 15, 22], [ 8, 17, 27, 38]])
인덱싱 , 슬라이싱 및 반복
목록 및 기타 Python 시퀀스와 마찬가지로 1차원 배열도 인덱싱, 슬라이싱 및 반복이 가능합니다.
>>> a= np.arange(10)**3 #记住,操作符是对数组中逐元素处理的! >>> a array([0, 1, 8, 27, 64, 125, 216, 343, 512, 729]) >>> a[2] 8 >>> a[2:5] array([ 8, 27, 64]) >>> a[:6:2]= -1000 # 等同于a[0:6:2]= -1000,从开始到第6个位置,每隔一个元素将其赋值为-1000 >>> a array([-1000, 1,-1000, 27,-1000, 125, 216, 343, 512, 729]) >>> a[: :-1] # 反转a array([ 729, 512, 343, 216, 125,-1000, 27,-1000, 1,-1000]) >>>for i in a: ... print i**(1/3.), ... nan 1.0 nan 3.0 nan 5.0 6.0 7.0 8.0 9.0
다차원 배열은 축당 하나의 인덱스를 가질 수 있습니다. 인덱스는 쉼표로 구분된 튜플로 제공됩니다.
>>>def f(x,y): ... return 10*x+y ... >>> b= np.fromfunction(f,(5,4),dtype=int) #fromfunction是一个函数,下篇文章介绍。 >>> b array([[ 0, 1, 2, 3], [10, 11, 12, 13], [20, 21, 22, 23], [30, 31, 32, 33], [40, 41, 42, 43]]) >>> b[2,3] 23 >>> b[0:5, 1] # 每行的第二个元素 array([ 1, 11, 21, 31, 41]) >>> b[: ,1] # 与前面的效果相同 array([ 1, 11, 21, 31, 41]) >>> b[1:3,: ] # 每列的第二和第三个元素 array([[10, 11, 12, 13], [20, 21, 22, 23]])
제공된 인덱스의 개수가 축의 개수보다 적을 경우, 주어진 값을 순위순으로 복사하며 누락된 인덱스는 기본값으로 설정 to는 전체 슬라이스입니다.
>>> b[-1] # 最后一行,等同于b[-1,:],-1是第一个轴,而缺失的认为是:,相当于整个切片。 array([40, 41, 42, 43])
b[i] 괄호 안의 표현식은 i와 일련의 :로 처리되어 나머지 축을 나타냅니다. NumPy를 사용하면 b[i,...]와 같은 "포인트"를 사용할 수도 있습니다.
점(…)은 완전한 인덱스 튜플을 생성하는 데 필요한 세미콜론 수를 나타냅니다. x가 랭크 5의 배열인 경우(즉, 5개의 축이 있음)
x[1,2,…]는 x[1,2,:,:와 동일합니다. ,:],
x[…,3]은 x[:,:,:,:,3]
x와 동일합니다. [ 4,…,5,:]는 x[4,:,:,5,:]
>>> c= array( [ [[ 0, 1, 2], #三维数组(两个2维数组叠加而成) ...[ 10, 12, 13]], ... ...[[100,101,102], ...[110,112,113]]] ) >>> c.shape (2, 2, 3) >>> c[1,...] #等同于c[1,:,:]或c[1] array([[100, 101, 102], [110, 112, 113]]) >>> c[...,2] #等同于c[:,:,2] array([[ 2, 13], [102, 113]])
순회와 동일합니다. 다차원 배열의 첫 번째 축을 기준으로 합니다:
>>>for row in b: ... print row ... [0 1 2 3] [10 11 12 13] [20 21 22 23] [30 31 32 33] [40 41 42 43]
배열의 각 요소를 처리하려면 flat 속성을 사용할 수 있습니다. 배열 요소 반복자입니다:
>>>for element in b.flat: ... print element, ... 0 1 2 3 10 11 12 13 20 21 22 23 30 31 32 33 40 41 42 43
모양 연산
배열 모양 변경
배열은 각 축의 요소 수에 따라 다릅니다.
>>> a= np.floor(10*np.random.random((3,4))) >>> a array([[ 7., 5., 9., 3.], [ 7., 2., 7., 8.], [ 6., 8., 3., 2.]]) >>> a.shape (3, 4)
를 사용할 수 있습니다. 모양 수정
>>> a.ravel() # 平坦化数组 array([ 7., 5., 9., 3., 7., 2., 7., 8., 6., 8., 3., 2.]) >>> a.shape= (6, 2) >>> a.transpose() array([[ 7., 9., 7., 7., 6., 3.], [ 5., 3., 2., 8., 8., 2.]])
ravel()에 의해 평면화된 배열 요소의 순서는 일반적으로 동작에 따라 "C 스타일"입니다. , 가장 오른쪽 인덱스가 가장 빠르게 변경되므로 요소 a[0,0] 뒤에 a[0,1]이 옵니다. 배열의 모양을 다른 모양으로 변경해도 배열은 여전히 "C 스타일"입니다. NumPy는 일반적으로 이 순서대로 데이터를 보유하는 배열을 생성하므로 ravel()은 일반적으로 호출 배열의 복사본을 생성할 필요가 없습니다. 그러나 배열이 다른 배열을 통해 분할되거나 특이한 옵션이 있는 경우 해당 배열의 복사본을 만들어야 할 수도 있습니다. 또한 일부 선택적 매개 변수 함수를 사용하여 reshape() 및 ravel()이 FORTRAN 스타일 배열을 구성하도록 할 수 있습니다. 즉, 가장 왼쪽 인덱스가 가장 빠르게 변경됩니다.
reshape 함수는 호출 배열의 모양을 변경하고 배열을 반환하는 반면, resize 함수는 호출 배열 자체를 변경합니다.
>>> a array([[ 7., 5.], [ 9., 3.], [ 7., 2.], [ 7., 8.], [ 6., 8.], [ 3., 2.]]) >>> a.resize((2,6)) >>> a array([[ 7., 5., 9., 3., 7., 2.], [ 7., 8., 6., 8., 3., 2.]])
reshape 작업에서 치수를 -1로 지정하면 실제 상황에 따라 정확한 치수가 계산됩니다
위 내용은 이 글의 전체 내용입니다. 모든 분들의 학습에 도움이 되기를 바랍니다.
NumPy의 간결한 튜토리얼을 더 깊이 이해하려면---Array 2 관련 기사를 PHP 중국어 웹사이트에 주목하세요!