在開發過程中,函數的返回值類型應該是確定不變的,但PHP是弱類型的語言,
所以PHP是沒有此類語法驗證的,正因為如此,造成了很多坑坑。
例如下面的程式碼:
<?php function getArticles(…){ $arrData = array(); if($exp1){ return $arrData; }else if($exp2){ return 1; }else{ return false; } } $arrData =getArticles(…); foreach($arrData as $record){ //do something. …. } ?>
函數getArticles依照不同的條件回傳不同型別的值,有bool、int、還有數組,正常情況這類函數是希望回傳數組,然後拿數組去做一些其他操作,
可因為函數回傳值型別不固定,呼叫時就很可能產生各種預想不到的坑,
因此我就想,既然不能規範,那就直接強制好了。
函數/方法傳回值可以強制型別類型,如圖
支援四種強制型別限制:int、array、bool、object,當傳回值與函式宣告中的型別不符時,拋出warning,本來想拋出error,但覺得
太狠了,只能算是個異常,不能算錯誤,所以就用warning好了。
PHP本身是不支持int function 這樣的語法的,所以要支持,就先要搞定語法解析器,關於語法解析器,可以移步這裡>>>查看
詳情,這裡就不講了,
先修改語法掃描Zend/zend_language_scanner.l檔案
增加如下程式碼:
<ST_IN_SCRIPTING>”int” { return T_FUNCTION_RETURN_INT; } <ST_IN_SCRIPTING>”bool” { return T_FUNCTION_RETURN_OBJECT; } <ST_IN_SCRIPTING>”object” { return T_FUNCTION_RETURN_OBJECT; } <ST_IN_SCRIPTING>”resource” { return T_FUNCTION_RETURN_RESOURCE; }
意思很簡單,掃描器掃描到關鍵字int、bool、object、resource、array時回傳的T_FUNCTION_* ,這是一個對應的token,
scanner根據不同的token做不同的處理,token要先在Zend/zend_language_parser.y檔案中定義
增加如下程式碼
………. %token T_FUNCTION_RETURN_INT %token T_FUNCTION_RETURN_BOOL %token T_FUNCTION_RETURN_STRING %token T_FUNCTION_RETURN_OBJECT %token T_FUNCTION_RETURN_RESOURCE 1 然后增加token处理逻辑: 1 function: T_FUNCTION { $$.u.opline_num = CG(zend_lineno);$$.u.EA.var = 0; } | T_FUNCTION_RETURN_INT T_FUNCTION { $$.u.opline_num = CG(zend_lineno); $$.u.EA.var = IS_LONG; } | T_FUNCTION_RETURN_BOOL T_FUNCTION { $$.u.opline_num = CG(zend_lineno); $$.u.EA.var = IS_BOOL; } | T_FUNCTION_RETURN_STRING T_FUNCTION { $$.u.opline_num = CG(zend_lineno); $$.u.EA.var = IS_STRING; } | T_FUNCTION_RETURN_OBJECT T_FUNCTION { $$.u.opline_num = CG(zend_lineno); $$.u.EA.var = IS_OBJECT; } | T_FUNCTION_RETURN_RESOURCE T_FUNCTION { $$.u.opline_num = CG(zend_lineno); $$.u.EA.var = IS_RESOURCE; } | T_ARRAY T_FUNCTION { $$.u.opline_num = CG(zend_lineno); $$.u.EA.var = IS_ARRAY; }
$$.u.EA.var 儲存的是函數回傳類型,最後要拿他來跟回傳值型別做匹配,
這樣語法解釋器就可以處理我們新的php語法了。
這還不夠,還需要修改函數宣告定義的處理邏輯
Zend/zend_compile.c ::zend_do_begin_function_declaration …… zend_op_array op_array; char *name = function_name->u.constant.value.str.val; int name_len = function_name->u.constant.value.str.len; int function_type = function_token->u.EA.var; //保存函数类型,在语法解释器中增加的: $$.u.EA.var = IS_LONG; int function_begin_line = function_token->u.opline_num; …… op_array.function_name = name; op_array.fn_type = function_type; //将类型保存到op_array中, op_array.return_reference = return_reference; op_array.fn_flags |= fn_flags; op_array.pass_rest_by_reference = 0; ……….
PHP是先解析PHP語法產生對應的opcode,將所需的環境、參數資訊儲存到execute_data全域變數中,最後在透過execute函數逐一執行opcode,
所以要做處理就要把函數的型別存到opcode中:op_array.fn_type = function_type;
op_array是沒有fn_type的,要修改op_array的結構,增加zend_uint fn_type;想像從c轉為彙編,我部落格中也有相關文章,可以參考一下)
最後要修改opcode的毀掉函數,函數的回傳return 會產生token T_RETURN,T_RETURN會根據傳回的型別呼叫不同的calback函數:
ZEND_RETURN_SPEC_CONST_HANDLER ZEND_RETURN_SPEC_TMP_HANDLER ZEND_RETURN_SPEC_VAR_HANDLER
它有三個callback,如果回傳值是一個const型別的數據,則ZEND_RETURN_SPEC_CONST_HANDLER
回傳值是臨時數據,如: return 1,則ZEND_RETURN_SPEC_TMP_HANDLER🟎ER_DLER
所以要在這三個callback函數中增加處理邏輯:
if((EG(active_op_array)->fn_type > 0) && Z_TYPE_P(retval_ptr) != EG(active_op_array)->fn_type){ php_error_docref0(NULL TSRMLS_DC,E_WARNING, “function name %s return a wrong type.”, EG(active_op_array)->function_name ); }