简介 该调研是2013年10月份做的,目标是寻找更好的PHP引擎,来代替百度各产品线正在使用的PHP 5.2。 环境说明 机器环境: cpu: Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz, 12核。 内存:64G 引擎: php 5.2.17 (当时百度所用版本) php 5.5.4 (当时最新版本
该调研是2013年10月份做的,目标是寻找更好的PHP引擎,来代替百度各产品线正在使用的PHP 5.2。
机器环境:
引擎:
为了公平起见,三个引擎都采用-O2的编译优化选项。
加速器:
扩展:
由于目前的百度扩展只有很少移植到了hhvm,所以为了公平起见,其它百度扩展也在php5.2和php5.5中禁用,而采用纯php的方式实现,实践证明采用纯php实现性能并未有太大损失。
下面用了不同的场景,来比较PHP引擎的性能。
用php官方提供的测试脚本:
测试结果如下:
引擎 | bench.php 耗时 | micro_bench.php 耗时 | bench_third.php 耗时 |
---|---|---|---|
php5.2 | 6.692s | 41.890s | 9.226s |
php5.5 | 3.609s | 14.972s | 5.893s |
hhvm | 0.579s | 5.832s | 2.869s |
分析:php历次新版本对性能都有优化,因此php5.5在纯cpu计算上比php5.2有明显优势。而hhvm采用jit机制,将php转化为本地代码执行,所以性能上比执行opcode的php5.5还要快上很多。
结论:对于纯cpu型计算,hhvm>>php5.5>>php5.2。
简单的http服务即由一个简单的php逻辑接口层加一个后端C模块(或通用存储)构成的服务,这里用了百度内部一个实际的简单服务为例。
简单做了一下性能测试,client并发10,client与service同机部署,service与后端C模块不同机部署。结果如下:
引擎 | 平均响应时间 | Cpu idle | Qps |
---|---|---|---|
php5.2 | 3.6ms | 50% | 1900 |
php5.5 | 2.9ms | 60% | 2500 |
hhvm | 2.0ms | 60% | 3900 |
分析:对于简单http服务,自身也有一部分的逻辑计算,除此之外,hhvm是webserver与php引擎一体化,不需要webserver->php这一层的开销,因此在响应时间和qps上有更明显的优势。由于C模块后端本身响应时间较短(1ms),所以不同引擎的整体响应时间的区别就比较明显。
结论:简单http服务,在qps上hhvm>>php5.5>php5.2,在响应时间上,除掉后端服务耗时,也是hhvm>>php5.5>php5.2。
这里用了贴吧的最新版ui,串行访问后端。
采用20个并发,测试结果如下:
引擎 | 整体耗时 | 除访问后端之外的耗时 | idle | qps |
---|---|---|---|---|
php5.2 | 520ms | 127ms | 50% | 40 |
php5.5 | 500ms | 107ms | 45% | 45 |
hhvm | 470ms | 72ms | 65% | 50 |
分析:ui大部分时间消耗在后端服务访问,这方面引擎不起作用。而另一方面,除后端服务外的耗时也很高,这部分对cpu消耗较大,导致qps较低。
显然,这个效果并不是很符合我们的预期,为了达到理想的qps,我们需要想方法进一步降低除后端之外的耗时。
首先我们在PHP5.2下运行xhprof,找出了一些较耗时的函数,并进行了优化:
15ms
4.3ms
1.8ms
通过上面几个优化,HHVM下ui的耗时降到了52ms,其中模板耗时34ms。但是这样仍不令人满意,如何进一步优化呢?
既然上面的xhprof是在PHP5.2下执行的,那我们尝试直接在HHVM下运行xhprof会如何?结果发现,HHVM下xhprof的结果与PHP5.2下有很大不同,发现了一些新的优化点,进行了优化:
16ms
7ms
1ms
通过上面的优化,我们将HHVM下ui的耗时降到了26ms。那么,同样的优化,作用在PHP5.2或PHP5.5下又如何呢?
引擎 | 优化前 | 业务优化后 |
---|---|---|
php5.2 | 127ms | 103ms |
php5.5 | 107ms | 87ms |
hhvm | 72ms | 26ms |
令人失望。。。究其原因,是因为在php下耗时在各函数的分布相当分散,即使优化个别函数,也难以有大辐提升。
而在hhvm下,由于引擎本身性能较高,因此一些原来实现得不合理而比较耗时的函数就突显出来了,因此针对这些函数进行优化,可以取得更加明显的效果。
结论:对于产品前端UI,引擎可以在一定程度上优化响应时间和qps,hhvm>php5.5>php5.2,如再结合一些针对hhvm的优化,可以大幅提升hhvm下的qps。
语言方面的兼容性来自两个方面:
hhvm是基于php5.4的语法标准,因此,hhvm和php5.5与我们目前用的php5.2都存在语法差异,php5.5差异更大一些。
目前所遇到的差异个数如下:
引擎 | 影响处理结果 | 不影响结果,打warning |
---|---|---|
php5.5 | 1个 | 1个 |
hhvm | 1个 | 1个 |
所有差异可见这里:
由于是两套不同实现,因此hhvm与zend引擎也有差异。
目前遇到的差异数如下:
影响处理结果 | 不影响结果,打warning |
---|---|
2个 | 0个 |
hhvm文档也提到了一些差异:https://github.com/facebook/hhvm/blob/master/hphp/doc/inconsistencies
结论:总体上,hhvm与php5.5在语言方面与php5.2都存在一些差异,并且对处理结果造成影响。不过,大部分的差异都会导致执行时报fatal或warning,我们只需根据相应提示修改代码即可,改动成本不大。
将原百度用到的扩展在php5.5下编译,大部分能编译通过,少数编译失败:
hhvm内置了很多常用的第三方扩展,因此对于第三方扩展,基本无须迁移。主要需要考虑的是百度扩展的迁移。
hhvm编写扩展有两种方式:
一、静态编译
缺点:
优点:
二、动态加载(HNI:hhvm native interface)
动态加载更为方便,因此推荐使用这种方式编写扩展。
三、ZendCompatLayer
hhvm正在实现一个ZendCompatLayer,即兼容zend扩展的一个层,实现zend引擎相关api,以方便现有扩展迁移到hhvm。具体见: https://github.com/facebook/hhvm/blob/master/hphp/doc/php.extension.compat.layer
按照其描述,zend扩展可以不做太多修改,即可迁移到hhvm。
耗时 | 实现方式 |
---|---|
199 ms | HNI |
769 ms | HNI+ZendCompat |
348 ms | php5.2 |
结论:ZendCompatLayer目前还不完善,很多api未实现,另外性能还较差,对性能要求高的扩展还是建议用hhvm原生方式实现,而长尾扩展可以用ZendCompatLayer,减少迁移与维护成本。
结论:php5.5对扩展保持较好的兼容性,迁移成本不高。hhvm目前扩展迁移成本较高,不过如果有ZendCompatLayer,也能大大减小迁移成本,可以等ZendCompatLayer完善之后,再做进一步调研。
php5.5对操作系统基本没有什么要求。
hhvm对系统要求较高,需要在ubuntu/centos下编译、运行,百度大部分机器不符合条件。。
不过,经过研究后发现,可以通过打包so方式,让hhvm能在百度机器运行,上面的测试都是在百度机器上进行的,没有发现什么问题。
根据同样的原理,通过打包依赖so和头文件,也能让hhvm在百度机器上编译,已经成功编译。
内核方面,hhvm要求至少2.6.32系统,百度大部分系统都符合要求。
结论:系统兼容性上,php5.5和hhvm都没有什么问题。
php5.5对php.ini保持兼容,但php-fpm.conf则变成ini格式,原来的php-fpm.conf需要修改,并且php-fpm也被编译成一个单独的可执行文件,而不再和php-cgi共用。
hhvm的配置是一种新的hdf格式,而且其配置项都不相同,不一定每个php.ini配置都能找到对应的配置项,不过常见的都有。新版hhvm也支持指定php.ini文件了,不过仍然不能支持所有配置项。
hhvm是webserver与php一体化,webserver的常见功能,如rewrite、简单防攻击、proxy、日志、静态文件服务也都有。因此webserver的相关配置也要成hhvm的配置格式。不过现在HHVM也支持fastcgi模式了,所以这个已经不成问题。
结论:配置兼容性上php5.5更好一些。不过配置文件也并不多,人工改造成本也不是很高,因此这方面问题并不大。
php从5.3到5.5增加了很多新功能,具体可以见:
总体上可概括为语法更灵活,功能更丰富。
hhvm的语法基于5.4,库的支持也不如php5.5丰富。但hhvm提供了几个功能,可能对性能优化会有很大帮助:
上述功能的介绍详见:
php5.5的开发者支持很好,文档全,api非常稳定。
相比之下,hhvm的开发者支持目前还比较弱,文档很少,很多地方要自己摸索,api还不太稳定,不过hhvm的社区很活跃,github有很多人在提issue和patch,hhvm官方团队也很给力,迭代速度很快,每8周发布一个稳定版本。
总体上,使用php5.5,性能会有一定提升,迁移成本较小。
使用hhvm,性能会有很大提升,但迁移成本会较大,主要是扩展方面的迁移成本。
UPDATE
看这里的结论很明显,百度大部分产品线使用了HHVM,因为我们相信资源的节约对于 我们这么大规模的应用收益很大。
读到这里,你可能会有疑问思考你到底要不要升级到HHVM?你想知道PHP7对比怎么样?
这里是你需要迁移HHVM的原因:
同样,这也有不建议迁移HHVM的原因:
这还有一些答疑:
A: HHVM的多线程模型是相对PHP-FPM不稳定,但是有非常多的进程守护解决方案可以很好的解决, 这个不是个问题,以百度现在的运维来看比较稳定。
Q:PHP7的性能不是已经不错了么?为什么还要迁移到HHVM?
A:首先PHP7还处于开发状态,首先迁移大版本的风险还是有的,至少现在考虑是不靠谱的,如果愿意等, 可以等到PHP7出来以后来进行对比。看看哪个更适合你,目前这个阶段HHVM是比PHP更优的选择。
做你们的测试(Do Your Own Benchmarking)
如果你们决定迁移了,那么开始前也建议做一次你们业务相关的评测,以确保收益在预期范围内。
原文地址:PHP 引擎调研, 感谢原作者分享。