有时,优雅的实现是一个函数。不是方法。不是类。不是框架。只是函数。 - John Carmack,游戏《毁灭战士》首席程序员
函數式程式設計全都是關於如何把一個問題分解為一系列函數的。通常,函數會鏈在一起,互相嵌套, 來回傳遞,被視作頭等公民。如果你使用過諸如jQuery或Node.js這樣的框架,你應該用過一些這樣的技術, 只不過你沒有意識到。
我們從Javascript的一個小尷尬開始。
假設我們需要一個值的列表,這些值會賦值給普通的物件。這些物件可能包含任何東西:資料、HTML物件等等。
var obj1 = {value: 1}, obj2 = {value: 2}, obj3 = {value: 3}; var values = []; function accumulate(obj) { values.push(obj.value); } accumulate(obj1); accumulate(obj2); console.log(values); // Output: [obj1.value, obj2.value]
這個程式碼能用但是不穩定。任何程式碼都可以不透過accumulate()函數來改變values物件。 而且如果我們忘了給values賦上空數組[],這個程式碼壓根兒就不會運作。
但是如果變數宣告在函數內部,他就不會被任何搗蛋的程式碼給更改。
function accumulate2(obj) { var values = []; values.push(obj.value); return values; } console.log(accumulate2(obj1)); // Returns: [obj1.value] console.log(accumulate2(obj2)); // Returns: [obj2.value] console.log(accumulate2(obj3)); // Returns: [obj3.value]
不行呀!只有最後傳入的那個物件的值才會被回傳。
我們也許可以透過在第一個函數內部嵌套一個函數來解決這個問題。
var ValueAccumulator = function(obj) { var values = [] var accumulate = function() { values.push(obj.value); }; accumulate(); return values; };
可是問題依然存在,而且我們現在無法存取accumulate函數和values變數了。
我們需要的是一個自呼叫函數
自呼叫函數與閉包
如果我們能夠傳回一個可以依序回傳values陣列的函數表達式怎麼樣?在函數內宣告的變數可以被函數內的所有程式碼存取到, 包括自呼叫函數。
透過使用自呼叫函數,前面的尷尬消失了。
var ValueAccumulator = function() { var values = []; var accumulate = function(obj) { if (obj) { values.push(obj.value); return values; } else { return values; } }; return accumulate; }; //This allows us to do this: var accumulator = ValueAccumulator(); accumulator(obj1); accumulator(obj2); console.log(accumulator()); // Output: [obj1.value, obj2.value] ValueAccumulator = -> values = [] (obj) -> values.push obj.value if obj values
這些都是關於作用域的。變數values在內部函數accumulate()中可見,即便是在外部的程式碼在呼叫這個函數時。 這叫閉包。
Javascript中的閉包就是函數可以存取父作用域,即使父函數已經執行完畢。
閉包是所有函數式語言都具有的特徵。傳統的命令式語言沒有閉包。
高階函數
自呼叫函數其實是高階函數的一種形式。高階函數就是以其它函數為輸入,或是傳回一個函數為輸出的函數。
高階函數在傳統的程式設計中並不常見。當命令式程式設計師使用循環來迭代陣列的時候,函數式程式設計師會採用完全不同的一種實作方式。 透過高階函數,陣列中的每一個元素可以被應用到一個函數上,並傳回新的陣列。
這是函數式程式設計的中心思想。高階函數具有把邏輯像物件一樣傳遞給函數的能力。
在Javascript中,函數被當作頭等公民對待,這和Scheme、Haskell等經典函數是語言一樣的。 這話聽起來可能有點古怪,其實實際意思就是函數被當作基本型,就像數字和物件一樣。 如果數字和物件可以被來回傳遞,那麼函數也可以。
來實際看看。現在把上一節的ValueAccumulator()函數配合高階函數使用:
// 使用forEach()來遍歷一個數組,並對其每個元素呼叫回調函數accumulator2
var accumulator2 = ValueAccumulator();
var objects = [obj1, obj2, obj3]; // 這個陣列可以很大
objects.forEach(accumulator2);
console.log(accumulator2());
純函數
純函數傳回的計算結果僅與傳入的參數相關。這裡不會使用外部的變數和全域狀態,也沒有副作用。 換句話說就是不能改變作為輸入傳入的變數。所以,程式裡只能使用純函數傳回的值。
用數學函數來舉一個簡單的例子。 Math.sqrt(4)將總是傳回2,不使用任何隱藏的訊息,如設定或狀態, 而且不會帶來任何副作用。
純函數是數學上的「函數」的真實演繹,就是輸入和輸出的關係。它們思路簡單也便於重複使用。 由於純函數是完全獨立的,它們更適合一次又一次地使用。
舉例說明來比較非純函數和純函數。
// 把信息打印到屏幕中央的函数 var printCenter = function(str) { var elem = document.createElement("div"); elem.textContent = str; elem.style.position = 'absolute'; elem.style.top = window.innerHeight / 2 + "px"; elem.style.left = window.innerWidth / 2 + "px"; document.body.appendChild(elem); }; printCenter('hello world'); // 纯函数完成相同的事情 var printSomewhere = function(str, height, width) { var elem = document.createElement("div"); elem.textContent = str; elem.style.position = 'absolute'; elem.style.top = height; elem.style.left = width; return elem; }; document.body.appendChild( printSomewhere('hello world', window.innerHeight / 2) + 10 + "px", window.innerWidth / 2) + 10 + "px"));
非純函數依賴window物件的狀態來計算寬度和高度,自給自足的純函數則要求這些值作為參數傳入。 實際上它允許了資訊列印到任何地方,這也讓這個函數有了更多用途。
非純函數看起來是一個更容易的選擇,因為它在自己內部實現了追加元素,而不是返回元素。 傳回了值的純函數printSomewhere()則會在跟其他函數式程式設計技術的配合下有較好的表現。
var messages = ['Hi', 'Hello', 'Sup', 'Hey', 'Hola']; messages.map(function(s, i) { return printSomewhere(s, 100 * i * 10, 100 * i * 10); }).forEach(function(element) { document.body.appendChild(element); });
当一个函数是纯的,也就是不依赖于状态和环境,我们就不用管它实际是什么时候被计算出来。 后面的惰性求值将讲到这个。
匿名函数
把函数作为头等对象的另一个好处是匿名函数。
就像名字暗示的那样,匿名函数就是没有名字的函数。实际不止这些。它允许了在现场定义临时逻辑的能力。 通常这带来的好处就是方便:如果一个函数只用一次,没有必要给它浪费一个变量名。
下面是一些匿名函数的例子:
// 写匿名函数的标准方式 function() { return "hello world" }; // 匿名函数可以赋值给变量 var anon = function(x, y) { return x + y }; // 匿名函数用于代替具名回调函数,这是匿名函数的一个更常见的用处 setInterval(function() { console.log(new Date().getTime()) }, 1000); // Output: 1413249010672, 1413249010673, 1413249010674, ... // 如果没有把它包含在一个匿名函数中,他将立刻被执行, // 并且返回一个undefined作为回调函数: setInterval(console.log(new Date().getTime()), 1000) // Output: 1413249010671
下面是匿名函数和高阶函数配合使用的例子
function powersOf(x) { return function(y) { // this is an anonymous function! return Math.pow(x, y); }; } powerOfTwo = powersOf(2); console.log(powerOfTwo(1)); // 2 console.log(powerOfTwo(2)); // 4 console.log(powerOfTwo(3)); // 8 powerOfThree = powersOf(3); console.log(powerOfThree(3)); // 9 console.log(powerOfThree(10)); // 59049
这里返回的那个函数不需要命名,它可以在powersOf()函数外的任何地方使用,这就是匿名函数。
还记得累加器的那个函数吗?它可以用匿名函数重写
var obj1 = { value: 1 }, obj2 = { value: 2 }, obj3 = { value: 3 }; var values = (function() { // 匿名函数 var values = []; return function(obj) { // 有一个匿名函数! if (obj) { values.push(obj.value); return values; } else { return values; } } })(); // 让它自执行 console.log(values(obj1)); // Returns: [obj.value] console.log(values(obj2)); // Returns: [obj.value, obj2.value] obj1 = { value: 1 } obj2 = { value: 2 } obj3 = { value: 3 } values = do -> valueList = [] (obj) -> valueList.push obj.value if obj valueList console.log(values(obj1)); # Returns: [obj.value] console.log(values(obj2)); # Returns: [obj.value, obj2.value]
真棒!一个高阶匿名纯函数。我们怎么这么幸运?实际上还不止这些,这里面还有个自执行的结构, (function(){...})();。函数后面跟的那个括号可以让函数立即执行。在上面的例子里, 给外面values赋的值是函数执行的结果。
匿名函数不仅仅是语法糖,他们是lambda演算的化身。请听我说下去…… lambda演算早在计算机和计算机语言被发明的很久以前就出现了。它只是个研究函数的数学概念。 非同寻常的是,尽管它只定义了三种表达式:变量引用,函数调用和匿名函数,但它被发现是图灵完整的。 如今,lambda演算处于所有函数式语言的核心,包括javascript。
由于这个原因,匿名函数往往被称作lambda表达式。
匿名函数也有一个缺点,那就是他们在调用栈中难以被识别,这会对调试造成一些困难。要小心使用匿名函数。
方法链
在Javascript中,把方法链在一起很常见。如果你使用过jQuery,你应该用过这种技巧。它有时也被叫做“建造者模式”。
这种技术用于简化多个函数依次应用于一个对象的代码。
// 每个函数占用一行来调用,不如…… arr = [1, 2, 3, 4]; arr1 = arr.reverse(); arr2 = arr1.concat([5, 6]); arr3 = arr2.map(Math.sqrt); // ……把它们串到一起放在一行里面 console.log([1, 2, 3, 4].reverse().concat([5, 6]).map(Math.sqrt)); // 括号也许可以说明是怎么回事 console.log(((([1, 2, 3, 4]).reverse()).concat([5, 6])).map(Math.sqrt));
这只有在函数是目标对象所拥有的方法时才有效。如果你要创建自己的函数,比如要把两个数组zip到一起, 你必须把它声明为Array.prototype对象的成员.看一下下面的代码片段:
Array.prototype.zip = function(arr2) {
// ...
}
这样我们就可以写成下面的样子
arr.zip([11,12,13,14).map(function(n){return n*2});
// Output: 2, 22, 4, 24, 6, 26, 8, 28
递归
递归应该是最著名的函数式编程技术。就是一个函数调用它自己。
当函数调用自己,有时奇怪的事情就发生了。它的表现即是一个循环,多次执行同样的代码,也是一个函数栈。
使用递归函数时必须十分小心地避免无限循环(这里应该说是无限递归)。就像循环一样,必须有个停止条件。 这叫做基准情形(base case)。
下面有个例子
var foo = function(n) { if (n < 0) { // 基准情形 return 'hello'; } else { // 递归情形 return foo(n - 1); } } console.log(foo(5));
译注:原文中的代码有误,递归情形的函数调用缺少return,导致函数执行得最后没有结果。这里已经纠正。
递归和循环可以相互转换。但是递归算法往往更合适,甚至是必要的,因为有些情形用循环很费劲。
一个明显的例子就是遍历树。
var getLeafs = function(node) { if (node.childNodes.length == 0) { // base case return node.innerText; } else { // recursive case: return node.childNodes.map(getLeafs); } }
分而治之
递归不只是代替for和while循环的有趣的方式。有个叫分而治之的算法,它递归地把问题拆分成更小的情形, 直到小到可以解决。
历史上有个欧几里得算法用于找出两个数的最大公分母
function gcd(a, b) { if (b == 0) { // 基准情形 (治) return a; } else { // 递归情形 (分) return gcd(b, a % b); } } console.log(gcd(12,8)); console.log(gcd(100,20)); gcb = (a, b) -> if b is 0 then a else gcb(b, a % b)
理论上来说,分而治之很牛逼,但是现实中有用吗?当然!用Javascript的函数对数组排序不是很好, 它不但替换了原数组,也就是说数据不是不变的,并且它还不够可靠、灵活。通过分而治之,我们可以做得更好。
全部的实现代码大概要40行,这里只展示伪代码:
var mergeSort = function(arr) { if (arr.length < 2) { // 基准情形: 只有0或1个元素的数组是不用排序的 return items; } else { // 递归情形: 把数组拆分、排序、合并 var middle = Math.floor(arr.length / 2); // 分 var left = mergeSort(arr.slice(0, middle)); var right = mergeSort(arr.slice(middle)); // 治 // merge是一个辅助函数,返回一个新数组,它将两个数组合并到一起 return merge(left, right); } }
译注:关于用分而治之的思路进行排序的一个更好的例子是快排,使用Javascript也只有13行代码。 具体请参考我以前的博文 《优雅的函数式编程语言》
惰性求值
惰性求值,也叫做非严格求值,它会按需调用并推迟执行,它是一种直到需要时才计算函数结果的求值策略, 这对函数式编程特别有用。比如有行代码是 x = func(),调用这个func()函数得到的返回值会赋值给x。 但是x等于什么一开始并不重要,直到需要用到x的时候。等到需要用x的时候才调用func()就是惰性求值。
这一策略可以让性能明显增强,特别是当使用方法链和数组这些函数式程序员最喜爱的程序流技术的时候。 惰性求值让人兴奋的一个优点是让无限序列成为可能。因为在它实在无法继续延迟之前,什么都不需要被真正计算出来。 它可以是这个样子:
// 理想化的JavaScript伪代码: var infinateNums = range(1 to infinity); var tenPrimes = infinateNums.getPrimeNumbers().first(10);
这为很多可能性敞开了大门,比如异步执行、并行计算、组合,这只列举了一点。
然而,还有个问题,Javascript本身并不支持惰性求值,也就是说存在让Javascript模拟惰性求值的函数库, 这是第三章的主题。