람다 함수 최적화
Nicolai Josuttis는 "C 표준 라이브러리"에서 컴파일러가 일반 함수보다 람다를 더 잘 최적화한다고 주장합니다. 이는 왜 그런지에 대한 의문을 제기합니다.
인라인 최적화
인라인 최적화가 람다와 일반 함수를 구별하지 않는다고 가정할 수도 있습니다. 그러나 주요 차이점은 함수 개체로서의 람다의 특성에 있습니다.
함수 개체와 함수 포인터
람다가 함수 템플릿에 전달되면 해당 객체에 대해 특별히 새 함수를 생성하여 사소하게 인라인 가능한 함수 호출을 생성합니다. 대조적으로 일반 함수는 함수 포인터를 전달하므로 일반적으로 인라인 최적화에 문제가 발생합니다. 컴파일러는 이론적으로 이러한 호출을 인라인할 수 있지만 주변 함수도 인라인된 경우에만 가능합니다.
예
반복자와 함수 개체를 다음과 같이 사용하는 함수 템플릿 맵을 고려하세요. 매개변수:
template <typename Iter, typename F> void map(Iter begin, Iter end, F f) { for (; begin != end; ++begin) *begin = f(*begin); }
이 템플릿 호출 Lambda:
int a[] = { 1, 2, 3, 4 }; map(begin(a), end(a), [](int n) { return n * 2; });
함수의 새 인스턴스화를 만듭니다.
template <> void map<int*, _some_lambda_type>(int* begin, int* end, _some_lambda_type f) { for (; begin != end; ++begin) *begin = f.operator()(*begin); }
컴파일러는 람다의 연산자()에 대한 호출을 쉽게 인라인할 수 있습니다.
그러나 다음과 같은 경우 함수 포인터 사용:
int a[] = { 1, 2, 3, 4 }; map(begin(a), end(a), &my_function);
결과 인스턴스화
template <> void map<int*, int (*)(int)>(int* begin, int* end, int (*f)(int)) { for (; begin != end; ++begin) *begin = f(*begin); }
여기서 f는 map에 대한 호출마다 다른 주소를 가리키며, map에 대한 주변 호출도 인라인되지 않는 한 인라인 최적화를 금지합니다.
따라서 최적화 이점은 람다는 사소한 인라인 기능을 가능하게 하는 함수 객체를 생성하는 능력에서 유래합니다.
위 내용은 컴파일러가 일반 함수보다 람다를 더 잘 최적화하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!