匿名函數在程式語言中出現的比較早,最早出現在Lisp語言中,隨後很多的程式語言都開始有這個功能了,
目前使用比較廣泛的Javascript以及C#,PHP直到5.3才開始真正支援匿名函數,C++的新標準C++0x也開始支援了。
匿名函數是一類別不需要指定標示符,而又可以被呼叫的函數或子例程,匿名函數可以方便的作為參數傳遞給其他函數,最常見應用是作為回調函數。
說到匿名函數,就不得不提到閉包了,閉包是詞法閉包(Lexical Closure)的簡稱,是引用了自由變數的函數,這個被應用的自由變數將和這個函數一同存在,即使離開了創建它的環境也一樣,所以閉包也可認為是有函數和與其相關引用組合而成的實體。在某些語言中,在函數內定義另一個函數的時候,如果內部函數引用到外部函數的變量,則可能產生閉包。在運行外部函數時,一個閉包就形成了。
這個字和匿名函數很容易被混用,其實這是兩個不同的概念,這可能是因為很多語言實作匿名函數的時候允許形成閉包。
前面提到PHP5.3才開始正式支援匿名函數,說到這裡可能會有細心讀者有意見了,因為有個函數是可以產生匿名函數的: create_function函數,在手冊裡可以查到這個函數在PHP4.1和PHP5就有了,這個函數通常也能作為匿名回呼函數使用,例如如下:
<?php $array = array(1, 2, 3, 4); array_walk($array, create_function('$value', 'echo $value'));
這段程式碼只是將陣列中的值依序輸出,當然也能做更多的事情。 那為什麼這不算真正的匿名函數呢,我們先看看這個函數的回傳值,這個函數回傳一個字串,通常我們可以像下面這樣呼叫一個函數:
<?php function a() { echo 'function a'; } $a = 'a'; $a();
我們在實作回呼函數的時候也可以採用這樣的方式,例如:
<?php function do_something($callback) { // doing # ... // done $callback(); }
這樣就能實現在函數do_something()執行完成之後呼叫$callback指定的函數。回到create_function函數的回傳值:函數傳回一個唯一的字串函數名,出現錯誤的話則回傳FALSE。這麼說這個函數也只是動態的創建了一個函數,而這個函數是有函數名的,也就是說,其實這並不是匿名的。只是創建了一個全域唯一的函數而已。
<?php $func = create_function('', 'echo "Function created dynamic";'); echo $func; // lambda_1 $func(); // Function created dynamic $my_func = 'lambda_1'; $my_func(); // 不存在这个函数 lambda_1(); // 不存在这个函数
上面這段程式碼的前面很好理解,create_function就是這麼用的,後面透過函數名稱來呼叫卻失敗了,這就有些不好理解了,php是怎麼保證這個函數是全域唯一的? lambda_1看起來也是一個很普通的函數名,如果我們先定義一個叫做lambda_1的函數呢?這裡函數的返回字串會是lambda_2,它在創建函數的時候會檢查是否這個函數是否存在知道找到合適的函數名,但如果我們在create_function之後定義一個叫做lambda_1的函數會怎麼樣呢? 這樣就出現函數重複定義的問題了,這樣的實作恐怕不是最好的方法,實際上如果你真的定義了名為lambda_1的函數也是不會出現我所說的問題的。這究竟是怎麼回事呢?上面程式碼的倒數2兩行也說明了這個問題,實際上並沒有定義名為lambda_1的函數。
也就是說我們的lambda_1和create_function返回的lambda_1並不是一樣的!? 怎麼會這樣呢? 那隻能說明我們沒有看到實質,只看到了表面,表面是我們在echo的時候輸出了lambda_1,而我們的lambda_1是我們自己敲入的. 我們還是使用debug_zval_dump函數來看看吧。
<?php $func = create_function('', 'echo "Hello";'); $my_func_name = 'lambda_1'; debug_zval_dump($func); // string(9) "lambda_1" refcount(2) debug_zval_dump($my_func_name); // string(8) "lambda_1" refcount(2)
看出來了吧,他們的長度居然不一樣,長度不一樣也即是說不是同一個函數,所以我們呼叫的函數當然是不存在的,我們還是直接看看create_function函數到底都做了些什麼吧。實作見: $PHP_SRC/Zend/zend_builtin_functions.c
#define LAMBDA_TEMP_FUNCNAME "lambda_func" ZEND_FUNCTION(create_function) { // ... 省去无关代码 function_name = (char *) emalloc(sizeof("0lambda_")+MAX_LENGTH_OF_LONG); function_name[0] = '\0'; // <--- 这里 do { function_name_length = 1 + sprintf(function_name + 1, "lambda_%d", ++EG(lambda_count)); } while (zend_hash_add(EG(function_table), function_name, function_name_length+1, &new_function, sizeof(zend_function), NULL)==FAILURE); zend_hash_del(EG(function_table), LAMBDA_TEMP_FUNCNAME, sizeof(LAMBDA_TEMP_FUNCNAME)); RETURN_STRINGL(function_name, function_name_length, 0); }
该函数在定义了一个函数之后,给函数起了个名字,它将函数名的第一个字符变为了'\0'也就是空字符,然后在函数表中查找是否已经定义了这个函数,如果已经有了则生成新的函数名, 第一个字符为空字符的定义方式比较特殊, 因为在用户代码中无法定义出这样的函数, 也就不存在命名冲突的问题了,这也算是种取巧(tricky)的做法,在了解到这个特殊的函数之后,我们其实还是可以调用到这个函数的, 只要我们在函数名前加一个空字符就可以了, chr()函数可以帮我们生成这样的字符串, 例如前面创建的函数可以通过如下的方式访问到:
<?php $my_func = chr(0) . "lambda_1"; $my_func(); // Hello
这种创建"匿名函数"的方式有一些缺点:
函数的定义是通过字符串动态eval的, 这就无法进行基本的语法检查;
这类函数和普通函数没有本质区别, 无法实现闭包的效果.
在PHP5.3引入的众多功能中, 除了匿名函数还有一个特性值得讲讲: 新引入的invoke 魔幻方法。
这个魔幻方法被调用的时机是: 当一个对象当做函数调用的时候, 如果对象定义了invoke魔幻方法则这个函数会被调用,这和C++中的操作符重载有些类似, 例如可以像下面这样使用:
<?php class Callme { public function invoke($phone_num) { echo "Hello: $phone_num"; } } $call = new Callme(); $call(13810688888); // "Hello: 13810688888
前面介绍了将对象作为函数调用的方法, 聪明的你可能想到在PHP实现匿名函数的方法了,PHP中的匿名函数就的确是通过这种方式实现的。我们先来验证一下:
<?php $func = function() { echo "Hello, anonymous function"; } echo gettype($func); // object echo get_class($func); // Closure
原来匿名函数也只是一个普通的类而已。熟悉Javascript的同学对匿名函数的使用方法很熟悉了,PHP也使用和Javascript类似的语法来定义, 匿名函数可以赋值给一个变量, 因为匿名函数其实是一个类实例, 所以能复制也是很容易理解的, 在Javascript中可以将一个匿名函数赋值给一个对象的属性, 例如:
var a = {}; a.call = function() {alert("called");} a.call(); // alert called
这在Javascript中很常见, 但在PHP中这样并不可以, 给对象的属性复制是不能被调用的, 这样使用将会导致类寻找类中定义的方法,在PHP中属性名和定义的方法名是可以重复的, 这是由PHP的类模型所决定的, 当然PHP在这方面是可以改进的, 后续的版本中可能会允许这样的调用,这样的话就更容易灵活的实现一些功能了。目前想要实现这样的效果也是有方法的: 使用另外一个魔幻方法call(),至于怎么实现就留给各位读者当做习题吧。
PHP使用闭包(Closure)来实现匿名函数, 匿名函数最强大的功能也就在匿名函数所提供的一些动态特性以及闭包效果,匿名函数在定义的时候如果需要使用作用域外的变量需要使用如下的语法来实现:
<?php $name = 'TIPI Team'; $func = function() use($name) { echo "Hello, $name"; } $func(); // Hello TIPI Team
这个use语句看起来挺别扭的, 尤其是和Javascript比起来, 不过这也应该是PHP-Core综合考虑才使用的语法, 因为和Javascript的作用域不同, PHP在函数内定义的变量默认就是局部变量, 而在Javascript中则相反,除了显式定义的才是局部变量, PHP在变异的时候则无法确定变量是局部变量还是上层作用域内的变量, 当然也可能有办法在编译时确定,不过这样对于语言的效率和复杂性就有很大的影响。
这个语法比较直接,如果需要访问上层作用域内的变量则需要使用use语句来申明, 这样也简单易读,说到这里, 其实可以使用use来实现类似global语句的效果。
匿名函数在每次执行的时候都能访问到上层作用域内的变量, 这些变量在匿名函数被销毁之前始终保存着自己的状态,例如如下的例子:
<?php function getCounter() { $i = 0; return function() use($i) { // 这里如果使用引用传入变量: use(&$i) echo ++$i; }; } $counter = getCounter(); $counter(); // 1 $counter(); // 1
和Javascript中不同,这里两次函数调用并没有使$i变量自增,默认PHP是通过拷贝的方式传入上层变量进入匿名函数,如果需要改变上层变量的值则需要通过引用的方式传递。所以上面得代码没有输出1, 2
而是1,1
。
前面提到匿名函数是通过闭包来实现的, 现在我们开始看看闭包(类)是怎么实现的。匿名函数和普通函数除了是否有变量名以外并没有区别,闭包的实现代码在$PHP_SRC/Zend/zend_closure.c。匿名函数"对象化"的问题已经通过Closure实现, 而对于匿名是怎么样访问到创建该匿名函数时的变量的呢?
例如如下这段代码:
<?php $i=100; $counter = function() use($i) { debug_zval_dump($i); }; $counter();
通过VLD来查看这段编码编译什么样的opcode了
$ php -dvld.active=1 closure.php vars: !0 = $i, !1 = $counter # * op fetch ext return operands ------------------------------------------------------------------------ 0 > ASSIGN !0, 100 1 ZEND_DECLARE_LAMBDA_FUNCTION '%00%7Bclosure 2 ASSIGN !1, ~1 3 INIT_FCALL_BY_NAME !1 4 DO_FCALL_BY_NAME 0 5 > RETURN 1 function name: {closure} number of ops: 5 compiled vars: !0 = $i line # * op fetch ext return operands -------------------------------------------------------------------------------- 3 0 > FETCH_R static $0 'i' 1 ASSIGN !0, $0 4 2 SEND_VAR !0 3 DO_FCALL 1 'debug_zval_dump' 5 4 > RETURN null
上面根据情况去掉了一些无关的输出, 从上到下, 第1开始将100赋值给!0也就是变量$i, 随后执行ZEND_DECLARE_LAMBDA_FUNCTION,那我们去相关的opcode执行函数中看看这里是怎么执行的, 这个opcode的处理函数位于$PHP_SRC/Zend/zend_vm_execute.h中:
static int ZEND_FASTCALL ZEND_DECLARE_LAMBDA_FUNCTION_SPEC_CONST_CONST_HANDLER(ZEND_OPCODE_HANDLER_ARGS) { zend_op *opline = EX(opline); zend_function *op_array; if (zend_hash_quick_find(EG(function_table), Z_STRVAL(opline->op1.u.constant), Z_STRLEN(opline->op1.u.constant), Z_LVAL(opline->op2.u.constant), (void *) &op_arra y) == FAILURE || op_array->type != ZEND_USER_FUNCTION) { zend_error_noreturn(E_ERROR, "Base lambda function for closure not found"); } zend_create_closure(&EX_T(opline->result.u.var).tmp_var, op_array TSRMLS_CC); ZEND_VM_NEXT_OPCODE(); }
该函数调用了zend_create_closure()函数来创建一个闭包对象, 那我们继续看看位于$PHP_SRC/Zend/zend_closures.c的zend_create_closure()函数都做了些什么。
ZEND_API void zend_create_closure(zval *res, zend_function *func TSRMLS_DC) { zend_closure *closure; object_init_ex(res, zend_ce_closure); closure = (zend_closure *)zend_object_store_get_object(res TSRMLS_CC); closure->func = *func; if (closure->func.type == ZEND_USER_FUNCTION) { // 如果是用户定义的匿名函数 if (closure->func.op_array.static_variables) { HashTable *static_variables = closure->func.op_array.static_variables; // 为函数申请存储静态变量的哈希表空间 ALLOC_HASHTABLE(closure->func.op_array.static_variables); zend_hash_init(closure->func.op_array.static_variables, zend_hash_num_elements(static_variables), NULL, ZVAL_PTR_DTOR, 0); // 循环当前静态变量列表, 使用zval_copy_static_var方法处理 zend_hash_apply_with_arguments(static_variables TSRMLS_CC, (apply_func_args_t)zval_copy_static_var, 1, closure->func.op_array.static_variables); } (*closure->func.op_array.refcount)++; } closure->func.common.scope = NULL; }
如上段代码注释中所说, 继续看看zval_copy_static_var()函数的实现:
static int zval_copy_static_var(zval **p TSRMLS_DC, int num_args, va_list args, zend_hash_key *key) { HashTable *target = va_arg(args, HashTable*); zend_bool is_ref; // 只对通过use语句类型的静态变量进行取值操作, 否则匿名函数体内的静态变量也会影响到作用域之外的变量 if (Z_TYPE_PP(p) & (IS_LEXICAL_VAR|IS_LEXICAL_REF)) { is_ref = Z_TYPE_PP(p) & IS_LEXICAL_REF; if (!EG(active_symbol_table)) { zend_rebuild_symbol_table(TSRMLS_C); } // 如果当前作用域内没有这个变量 if (zend_hash_quick_find(EG(active_symbol_table), key->arKey, key->nKeyLength, key->h, (void **) &p) == FAILURE) { if (is_ref) { zval *tmp; // 如果是引用变量, 则创建一个临时变量一边在匿名函数定义之后对该变量进行操作 ALLOC_INIT_ZVAL(tmp); Z_SET_ISREF_P(tmp); zend_hash_quick_add(EG(active_symbol_table), key->arKey, key->nKeyLength, key->h, &tmp, sizeof(zval*), (void**)&p); } else { // 如果不是引用则表示这个变量不存在 p = &EG(uninitialized_zval_ptr); zend_error(E_NOTICE,"Undefined variable: %s", key->arKey); } } else { // 如果存在这个变量, 则根据是否是引用, 对变量进行引用或者复制 if (is_ref) { SEPARATE_ZVAL_TO_MAKE_IS_REF(p); } else if (Z_ISREF_PP(p)) { SEPARATE_ZVAL(p); } } } if (zend_hash_quick_add(target, key->arKey, key->nKeyLength, key->h, p, sizeof(zval*), NULL) == SUCCESS) { Z_ADDREF_PP(p); } return ZEND_HASH_APPLY_KEEP; }
这个函数作为一个回调函数传递给zend_hash_apply_with_arguments()
函数, 每次读取到hash表中的值之后由这个函数进行处理,而这个函数对所有use语句定义的变量值赋值给这个匿名函数的静态变量, 这样匿名函数就能访问到use的变量了。
以上是詳解php 中的匿名函數與閉包的詳細內容。更多資訊請關注PHP中文網其他相關文章!