코드 최적화 1부
최근에 본 코드 최적화 팁을 공유해 주세요.
if 판단의 단락 특성
and의 경우 가장 적은 조건을 만족하는 것을 앞에 두도록 하여 다수의 판단을 했을 때 최소한의 조건을 만족하면 바로 다음 표현식으로 이어집니다. 시간을 절약하기 위해 계산되지 않습니다(False와 True는 여전히 False이므로)
import timeit s1 = """ a = range(2000) [i for i in a if i % 2 ==0 and i > 1900] """ s2 = """ a = range(2000) [i for i in a if i > 1900 and i % 2 ==0] """ print timeit.timeit(stmt=s1, number=1000) print timeit.timeit(stmt=s2, number=1000)
실행 결과는 다음과 같습니다.
➜ python test6.py 0.248532056808 0.195827960968 # 可以看到s2 表达式计算更快, 因为大部分情况都不满足 i>1900, 所以这些情况下, i % 2 == 0 也没有计算,从而节约了时间
or도 마찬가지로 조건을 가장 많이 만족하는 것을 먼저 올려주세요.
import timeit s1 = """ a = range(2000) [i for i in a if 10 < i <20 or 1000 < i < 2000] """ s2 = """ a = range(2000) [i for i in a if 1000 < i < 2000 or 10 < i <20] """ print timeit.timeit(stmt=s1, number=1000) print timeit.timeit(stmt=s2, number=1000)
결과 실행:
0.253124952316 0.202992200851
병합 문자열 조인
+를 반복하여 병합하는 것보다 빠르게 병합 문자열을 조인하세요.
import timeit s1 = """ a = [str(x) for x in range(2000)] s = '' for i in a: s += i """ s2 = """ a = [str(x) for x in range(2000)] s = ''.join(a) """ print timeit.timeit(stmt=s1, number=1000) print timeit.timeit(stmt=s2, number=1000)
실행 결과는 다음과 같습니다.
python test6.py 0.558945894241 0.422435998917
while 1 및 while True
python2.x에서는 True와 False가 예약어가 아니지만, 전역 변수, 이는
>>> True = 0 >>> True 0 >>> if not True: ... print '1' ... 1
따라서 다음 두 상황:
import timeit s1 = """ n = 1000000 while 1: n -= 1 if n <= 0: break """ s2 = """ n = 1000000 while True: n -= 1 if n <= 0: break """ print timeit.timeit(stmt=s1, number=100) print timeit.timeit(stmt=s2, number=100)
실행 결과는 다음과 같습니다.
➜ python test6.py 5.18007302284 6.84624099731
왜냐하면 True라고 판단할 때마다 먼저 True의 값을 찾아야 하기 때문입니다.
python3.x에서는 True가 키워드 매개변수가 되므로 위의 두 상황은 동일합니다.
cProfile, cStringIO 및 cPickle
C 버전을 사용하여 작성된 확장 프로그램은 기본 버전보다 빠릅니다. cPickle 대 pickle은 다음과 같습니다.
import timeit s1 = """ import cPickle import pickle n = range(10000) cPickle.dumps(n) """ s2 = """ import cPickle import pickle n = range(10000) pickle.dumps(n) """ print timeit.timeit(stmt=s1, number=100) print timeit.timeit(stmt=s2, number=100)
실행 결과는 다음과 같습니다.
➜ python test6.py 0.182178974152 1.70917797089
제너레이터의 합리적인 사용
차이점
()를 사용하면 생성자 객체에 필요한 메모리 공간은 리스트의 크기와 관계가 없으므로 효율성이 더 높아집니다.
import timeit s1 = """ [i for i in range (100000)] """ s2 = """ (i for i in range(100000)) """ print timeit.timeit(stmt=s1, number=1000) print timeit.timeit(stmt=s2, number=1000)
결과:
➜ python test6.py 5.44327497482 0.923446893692
그러나 루프 순회가 필요한 상황에서는 다음과 같이 반복자를 사용하는 것이 효율적이지 않습니다.
import timeit s1 = """ ls = range(1000000) def yield_func(ls): for i in ls: yield i+1 for x in yield_func(ls): pass """ s2 = """ ls = range(1000000) def not_yield_func(ls): return [i+1 for i in ls] for x in not_yield_func(ls): pass """ print timeit.timeit(stmt=s1, number=10) print timeit.timeit(stmt=s2, number=10)
결과는 다음과 같습니다.
➜ python test6.py 1.03186702728 1.01472687721
따라서 생성기를 사용하는 것은 메모리와 속도를 종합적으로 고려하는 트레이드오프입니다.
xrange
在python2.x里xrange 是纯C实现的生成器,相对于range来说,它不会一次性计算出所有值在内存中。但它的限制是只能和整型一起工作:你不能使用long或者float。
import 语句的开销
import语句有时候为了限制它们的作用范围或者节省初始化时间,被卸载函数内部,虽然python的解释器不会重复import同一个模块不会出错,但重复导入会影响部分性能。有时候为了实现懒加载(即使用的时候再加载一个开销很大的模块),可以这么做:
email = None def parse_email(): global email if email is None: import email ... # 这样一来email模块仅会被引入一次,在parse_email()被第一次调用的时候。