최근에 PHP 사람들이 여전히 작은 따옴표와 큰 따옴표에 대해 이야기하고 작은 따옴표를 사용하는 것은 미시적인 최적화에 불과하지만 항상 작은 따옴표를 사용하는 데 익숙해지면 CPU를 많이 절약할 수 있다는 이야기를 다시 들었습니다. 사이클!
"이미 모든 것이 말되었지만 아직 모든 사람이 말한 것은 아닙니다." – Karl Valentin
나는 이러한 정신으로 Nikita Popov가 이미 12년 전에 썼던 것과 동일한 주제에 대한 기사를 쓰고 있습니다(그의 기사를 읽고 있다면 여기에서 읽지 마세요).
PHP는 문자열 보간을 수행하여 문자열에서 변수의 사용을 검색하고 이를 사용된 변수의 값으로 바꿉니다.
$juice = "apple"; echo "They drank some $juice juice."; // will output: They drank some apple juice.
이 기능은 큰따옴표로 묶인 문자열과 heredoc로 제한됩니다. 작은따옴표(또는 nowdoc)를 사용하면 다른 결과가 나옵니다.
$juice = "apple"; echo 'They drank some $juice juice.'; // will output: They drank some $juice juice.
보세요: PHP는 작은따옴표로 묶인 문자열에 있는 변수를 검색하지 않습니다. 따라서 우리는 어디에서나 작은따옴표를 사용하기 시작할 수 있습니다. 그래서 사람들이 이런 변화를 제안하기 시작했어요..
- $juice = "apple"; + $juice = 'apple';
PHP는 해석된 언어임에도 불구하고 가상 머신이 실제로 실행할 수 있는 작업, 즉 opcode를 얻기 위해 특정 부분이 함께 작동하는 컴파일 단계를 사용합니다. 그렇다면 PHP 소스 코드에서 opcode로 어떻게 이동합니까?
어휘 분석기
T_OPEN_TAG (<?php ) T_ECHO (echo) T_WHITESPACE ( ) T_CONSTANT_ENCAPSED_STRING ("")
파서
{ "data": [ { "nodeType": "Stmt_Echo", "attributes": { "startLine": 1, "startTokenPos": 1, "startFilePos": 6, "endLine": 1, "endTokenPos": 4, "endFilePos": 13 }, "exprs": [ { "nodeType": "Scalar_String", "attributes": { "startLine": 1, "startTokenPos": 3, "startFilePos": 11, "endLine": 1, "endTokenPos": 3, "endFilePos": 12, "kind": 2, "rawValue": "\"\"" }, "value": "" } ] } ] }
컴파일러
opcode를 보려면 여러 가지 옵션이 있습니다(더 많을 수도 있지만 다음 세 가지를 알고 있습니다).
$ echo '<?php echo "";' > foo.php $ php -dopcache.opt_debug_level=0x10000 foo.php $_main: ... 0000 ECHO string("") 0001 RETURN int(1) 가설 <h2> </h2>작은따옴표와 큰따옴표를 사용할 때 CPU 주기를 절약한다는 초기 아이디어로 돌아가서, PHP가 모든 단일 요청에 대해 런타임에 이러한 문자열을 평가하는 경우에만 이것이 사실이라는 데 모두 동의한다고 생각합니다.<p> </p> 런타임에는 어떤 일이 발생하나요? <h2> </h2>그러면 PHP가 두 가지 버전에 대해 어떤 opcode를 생성하는지 살펴보겠습니다.<p> </p>큰따옴표:<p> <br> </p> <pre class="brush:php;toolbar:false"><?php echo "apple";
0000 ECHO string("apple") 0001 RETURN int(1)
<?php echo 'apple';
0000 ECHO string("apple") 0001 RETURN int(1)
어쩌면 ECHO opcode 처리기의 구현이 주어진 문자열을 구문 분석할 수도 있지만 그렇게 하도록 지시하는 마커나 다른 것이 없을 수도 있습니다... 흠 ?
다른 접근 방식을 시도하여 이 두 가지 경우에 대해 어휘 분석기가 수행하는 작업을 살펴보겠습니다.
큰따옴표:
T_OPEN_TAG (<?php ) T_ECHO (echo) T_WHITESPACE ( ) T_CONSTANT_ENCAPSED_STRING ("")
Line 1: T_OPEN_TAG (<?php ) Line 1: T_ECHO (echo) Line 1: T_WHITESPACE ( ) Line 1: T_CONSTANT_ENCAPSED_STRING ('')
새로운 가설
좀 더 "정교한" 예를 들어 확인해 보겠습니다.
<?php $juice="apple"; echo "juice: $juice";
T_OPEN_TAG (<?php) T_VARIABLE ($juice) T_CONSTANT_ENCAPSED_STRING ("apple") T_WHITESPACE () T_ECHO (echo) T_WHITESPACE ( ) T_ENCAPSED_AND_WHITESPACE (juice: ) T_VARIABLE ($juice)
Look at the last two tokens! String interpolation is handled in the lexer and as such is a compile time thing and has nothing to do with runtime.
For completeness, let's have a look at the opcodes generated by this (after optimisation, using 0x20000):
0000 ASSIGN CV0($juice) string("apple") 0001 T2 = FAST_CONCAT string("juice: ") CV0($juice) 0002 ECHO T2 0003 RETURN int(1)
This is different opcode than we had in our simple
Let's have a look at these three different versions:
<?php $juice = "apple"; echo "juice: $juice $juice"; echo "juice: ", $juice, " ", $juice; echo "juice: ".$juice." ".$juice;
The first opcode assigns the string "apple" to the variable $juice:
0000 ASSIGN CV0($juice) string("apple")
The first version (string interpolation) is using a rope as the underlying data structure, which is optimised to do as little string copies as possible.
0001 T2 = ROPE_INIT 4 string("juice: ") 0002 T2 = ROPE_ADD 1 T2 CV0($juice) 0003 T2 = ROPE_ADD 2 T2 string(" ") 0004 T1 = ROPE_END 3 T2 CV0($juice) 0005 ECHO T1
The second version is the most memory effective as it does not create an intermediate string representation. Instead it does multiple calls to ECHO which is a blocking call from an I/O perspective so depending on your use case this might be a downside.
0006 ECHO string("juice: ") 0007 ECHO CV0($juice) 0008 ECHO string(" ") 0009 ECHO CV0($juice)
The third version uses CONCAT/FAST_CONCAT to create an intermediate string representation and as such might use more memory than the rope version.
0010 T1 = CONCAT string("juice: ") CV0($juice) 0011 T2 = FAST_CONCAT T1 string(" ") 0012 T1 = CONCAT T2 CV0($juice) 0013 ECHO T1
So ... what is the right thing to do here and why is it string interpolation?
String interpolation uses either a FAST_CONCAT in the case of echo "juice: $juice"; or highly optimised ROPE_* opcodes in the case of echo "juice: $juice $juice";, but most important it communicates the intent clearly and none of this has been bottle neck in any of the PHP applications I have worked with so far, so none of this actually matters.
String interpolation is a compile time thing. Granted, without OPcache the lexer will have to check for variables used in double quoted strings on every request, even if there aren't any, waisting CPU cycles, but honestly: The problem is not the double quoted strings, but not using OPcache!
However, there is one caveat: PHP up to 4 (and I believe even including 5.0 and maybe even 5.1, I don't know) did string interpolation at runtime, so using these versions ... hmm, I guess if anyone really still uses PHP 5, the same as above applies: The problem is not the double quoted strings, but the use of an outdated PHP version.
Update to the latest PHP version, enable OPcache and live happily ever after!
위 내용은 큰따옴표가 너무 많은지 여부, 그것이 문제입니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!