목차
PHP 底层的运行机制与原理,php底层运行机制
php教程 php手册 PHP 底层的运行机制与原理,php底层运行机制

PHP 底层的运行机制与原理,php底层运行机制

Jun 13, 2016 am 08:50 AM
작동 메커니즘

PHP 底层的运行机制与原理,php底层运行机制

作者:nowamagic
로그인 후 복사
链接:http://www.nowamagic.net/librarys/veda/detail/102
로그인 후 복사

PHP说简单,但是要精通也不是一件简单的事。我们除了会使用之外,还得知道它底层的工作原理。

PHP是一种适用于web开发的动态语言。具体点说,就是一个用C语言实现包含大量组件的软件框架。更狭义点看,可以把它认为是一个强大的UI框架。

了解PHP底层实现的目的是什么?动态语言要像用好首先得了解它,内存管理、框架模型值得我们借鉴,通过扩展开发实现更多更强大的功能,优化我们程序的性能。

1. PHP的设计理念及特点

  • 多进程模型:由于PHP是多进程模型,不同请求间互不干涉,这样保证了一个请求挂掉不会对全盘服务造成影响,当然,随着时代发展,PHP也早已支持多线程模型。

  • 弱类型语言:和C/C++、Java、C#等语言不同,PHP是一门弱类型语言。一个变量的类型并不是一开始就确定不变,运行中才会确定并可能发生隐式或显式的类型转换,这种机制的灵活性在web开发中非常方便、高效,具体会在后面PHP变量中详述。

  • 引擎(Zend)+组件(ext)的模式降低内部耦合。

  • 中间层(sapi)隔绝web server和PHP。

  • 语法简单灵活,没有太多规范。缺点导致风格混杂,但再差的程序员也不会写出太离谱危害全局的程序。

2. PHP的四层体系

PHP的核心架构如下图:

从图上可以看出,PHP从下到上是一个4层体系:

  • Zend引擎:Zend整体用纯C实现,是PHP的内核部分,它将PHP代码翻译(词法、语法解析等一系列编译过程)为可执行opcode的处理并实现相应的处理方法、实现了基本的数据结构(如hashtable、oo)、内存分配及管理、提供了相应的api方法供外部调用,是一切的核心,所有的外围功能均围绕Zend实现。

  • Extensions:围绕着Zend引擎,extensions通过组件式的方式提供各种基础服务,我们常见的各种内置函数(如array系列)、标准库等都是通过extension来实现,用户也可以根据需要实现自己的extension以达到功能扩展、性能优化等目的(如贴吧正在使用的PHP中间层、富文本解析就是extension的典型应用)。

  • Sapi:Sapi全称是Server Application Programming Interface,也就是服务端应用编程接口,Sapi通过一系列钩子函数,使得PHP可以和外围交互数据,这是PHP非常优雅和成功的一个设计,通过sapi成功的将PHP本身和上层应用解耦隔离,PHP可以不再考虑如何针对不同应用进行兼容,而应用本身也可以针对自己的特点实现不同的处理方式。

  • 上层应用:这就是我们平时编写的PHP程序,通过不同的sapi方式得到各种各样的应用模式,如通过webserver实现web应用、在命令行下以脚本方式运行等等。

如果PHP是一辆车,那么车的框架就是PHP本身,Zend是车的引擎(发动机),Ext下面的各种组件就是车的轮子,Sapi可以看做是公路,车可以跑在不同类型的公路上,而一次PHP程序的执行就是汽车跑在公路上。因此,我们需要:性能优异的引擎+合适的车轮+正确的跑道。

3. Sapi

如前所述,Sapi通过通过一系列的接口,使得外部应用可以和PHP交换数据并可以根据不同应用特点实现特定的处理方法,我们常见的一些sapi有:

  • apache2handler:这是以apache作为webserver,采用mod_PHP模式运行时候的处理方式,也是现在应用最广泛的一种。

  • cgi:这是webserver和PHP直接的另一种交互方式,也就是大名鼎鼎的fastcgi协议,在最近今年fastcgi+PHP得到越来越多的应用,也是异步webserver所唯一支持的方式。

  • cli:命令行调用的应用模式

4. PHP的执行流程&opcode

我们先来看看PHP代码的执行所经过的流程。

从图上可以看到,PHP实现了一个典型的动态语言执行过程:拿到一段代码后,经过词法解析、语法解析等阶段后,源程序会被翻译成一个个指令(opcodes),然后ZEND虚拟机顺次执行这些指令完成操作。PHP本身是用C实现的,因此最终调用的也都是C的函数,实际上,我们可以把PHP看做是一个C开发的软件。

PHP的执行的核心是翻译出来的一条一条指令,也即opcode。

Opcode是PHP程序执行的最基本单位。一个opcode由两个参数(op1,op2)、返回值和处理函数组成。PHP程序最终被翻译为一组opcode处理函数的顺序执行。

常见的几个处理函数:

<p>ZEND_ASSIGN_SPEC_CV_CV_HANDLER : 变量分配 ($a=$b)</p>
<p>ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER:函数调用</p>
<p>ZEND_CONCAT_SPEC_CV_CV_HANDLER:字符串拼接 $a.$b</p>
<p>ZEND_ADD_SPEC_CV_CONST_HANDLER: 加法运算 $a+2</p>
<p>ZEND_IS_EQUAL_SPEC_CV_CONST:判断相等 $a==1</p>
<p>ZEND_IS_IDENTICAL_SPEC_CV_CONST:判断相等 $a===1</p>


로그인 후 복사

5. HashTable — 核心数据结构

HashTable是zend的核心数据结构,在PHP里面几乎并用来实现所有常见功能,我们知道的PHP数组即是其典型应用,此外,在zend内部,如函数符号表、全局变量等也都是基于hash table来实现。

PHP的hash table具有如下特点:

  • 支持典型的key->value查询

  • 可以当做数组使用

  • 添加、删除节点是O(1)复杂度

  • key支持混合类型:同时存在关联数组合索引数组

  • Value支持混合类型:array (“string”,2332)

  • 支持线性遍历:如foreach

Zend hash table实现了典型的hash表散列结构,同时通过附加一个双向链表,提供了正向、反向遍历数组的功能。其结构如下图:

可以看到,在hash table中既有key->value形式的散列结构,也有双向链表模式,使得它能够非常方便的支持快速查找和线性遍历。

  • 散列结构:Zend的散列结构是典型的hash表模型,通过链表的方式来解决冲突。需要注意的是zend的hash table是一个自增长的数据结构,当hash表数目满了之后,其本身会动态以2倍的方式扩容并重新元素位置。初始大小均为8。另外,在进行key->value快速查找时候,zend本身还做了一些优化,通过空间换时间的方式加快速度。比如在每个元素中都会用一个变量nKeyLength标识key的长度以作快速判定。

  • 双向链表:Zend hash table通过一个链表结构,实现了元素的线性遍历。理论上,做遍历使用单向链表就够了,之所以使用双向链表,主要目的是为了快速删除,避免遍历。Zend hash table是一种复合型的结构,作为数组使用时,即支持常见的关联数组也能够作为顺序索引数字来使用,甚至允许2者的混合。

  • PHP关联数组:关联数组是典型的hash_table应用。一次查询过程经过如下几步(从代码可以看出,这是一个常见的hash查询过程并增加一些快速判定加速查找。):

<p>getKeyHashValue h;</p>
<p>index = n & nTableMask;</p>
<p>Bucket *p = arBucket[index];</p>
<p>while (p) {</p>
<p>   if ((p->h == h) & (p->nKeyLength == nKeyLength)) {</p>
<p>       RETURN p->data;  </p>
<p>   }</p>
<p>   p=p->next;</p>
<p>}</p>


로그인 후 복사
  • PHP索引数组:索引数组就是我们常见的数组,通过下标访问。例如 $arr[0],Zend HashTable内部进行了归一化处理,对于index类型key同样分配了hash值和nKeyLength(为0)。内部成员变量nNextFreeElement就是当前分配到的最大id,每次push后自动加一。正是这种归一化处理,PHP才能够实现关联和非关联的混合。由于push操作的特殊性,索引key在PHP数组中先后顺序并不是通过下标大小来决定,而是由push的先后决定。例如 $arr[1] = 2; $arr[2] = 3;对于double类型的key,Zend HashTable会将他当做索引key处理

6. PHP变量

PHP是一门弱类型语言,本身不严格区分变量的类型。PHP在变量申明的时候不需要指定类型。PHP在程序运行期间可能进行变量类型的隐示转换。和其他强类型语言一样,程序中也可以进行显示的类型转换。PHP变量可以分为简单类型(int、string、bool)、集合类型(array resource object)和常量(const)。以上所有的变量在底层都是同一种结构 zval。

Zval是zend中另一个非常重要的数据结构,用来标识并实现PHP变量,其数据结构如下:

Zval主要由三部分组成:

  • type:指定了变量所述的类型(整数、字符串、数组等)

  • refcount&is_ref:用来实现引用计数(后面具体介绍)

  • value:核心部分,存储了变量的实际数据

Zvalue是用来保存一个变量的实际数据。因为要存储多种类型,所以zvalue是一个union,也由此实现了弱类型。

PHP变量类型和其实际存储对应关系如下:

<p>IS_LONG   -> lvalue</p>
<p>IS_DOUBLE -> dvalue</p>
<p>IS_ARRAY  -> ht</p>
<p>IS_STRING -> str</p>
<p>IS_RESOURCE -> lvalue</p>


로그인 후 복사

引用计数在内存回收、字符串操作等地方使用非常广泛。PHP中的变量就是引用计数的典型应用。Zval的引用计数通过成员变量is_ref和ref_count实现,通过引用计数,多个变量可以共享同一份数据。避免频繁拷贝带来的大量消耗。

在进行赋值操作时,zend将变量指向相同的zval同时ref_count++,在unset操作时,对应的ref_count-1。只有ref_count减为0时才会真正执行销毁操作。如果是引用赋值,则zend会修改is_ref为1。

PHP变量通过引用计数实现变量共享数据,那如果改变其中一个变量值呢?当试图写入一个变量时,Zend若发现该变量指向的zval被多个变量共享,则为其复制一份ref_count为1的zval,并递减原zval的refcount,这个过程称为“zval分离”。可见,只有在有写操作发生时zend才进行拷贝操作,因此也叫copy-on-write(写时拷贝)

对于引用型变量,其要求和非引用型相反,引用赋值的变量间必须是捆绑的,修改一个变量就修改了所有捆绑变量。

整数、浮点数是PHP中的基础类型之一,也是一个简单型变量。对于整数和浮点数,在zvalue中直接存储对应的值。其类型分别是long和double。

从zvalue结构中可以看出,对于整数类型,和c等强类型语言不同,PHP是不区分int、unsigned int、long、long long等类型的,对它来说,整数只有一种类型也就是long。由此,可以看出,在PHP里面,整数的取值范围是由编译器位数来决定而不是固定不变的。

对于浮点数,类似整数,它也不区分float和double而是统一只有double一种类型。

在PHP中,如果整数范围越界了怎么办?这种情况下会自动转换为double类型,这个一定要小心,很多trick都是由此产生。

和整数一样,字符变量也是PHP中的基础类型和简单型变量。通过zvalue结构可以看出,在PHP中,字符串是由由指向实际数据的指针和长度结构体组成,这点和c++中的string比较类似。由于通过一个实际变量表示长度,和c不同,它的字符串可以是2进制数据(包含),同时在PHP中,求字符串长度strlen是O(1)操作。

在新增、修改、追加字符串操作时,PHP都会重新分配内存生成新的字符串。最后,出于安全考虑,PHP在生成一个字符串时末尾仍然会添加

常见的字符串拼接方式及速度比较:

假设有如下4个变量:$strA=‘123’; $strB = ‘456’; $intA=123; intB=456;

现在对如下的几种字符串拼接方式做一个比较和说明:

<p>$res = $strA.$strB和$res = &ldquo;$strA$strB&rdquo;</p>
<p>这种情况下,zend会重新malloc一块内存并进行相应处理,其速度一般</p>
<p>$strA = $strA.$strB</p>
<p>这种是速度最快的,zend会在当前strA基础上直接relloc,避免重复拷贝</p>
<p>$res = $intA.$intB</p>
<p>这种速度较慢,因为需要做隐式的格式转换,实际编写程序中也应该注意尽量避免</p>
<p>$strA = sprintf (&ldquo;%s%s&rdquo;,$strA.$strB);</p>


로그인 후 복사

这会是最慢的一种方式,因为sprintf在PHP中并不是一个语言结构,本身对于格式识别和处理就需要耗费比较多时间,另外本身机制也是malloc。不过sprintf的方式最具可读性,实际中可以根据具体情况灵活选择。

PHP的数组通过Zend HashTable来天然实现。

foreach操作如何实现?对一个数组的foreach就是通过遍历hashtable中的双向链表完成。对于索引数组,通过foreach遍历效率比for高很多,省去了key->value的查找。count操作直接调用HashTable->NumOfElements,O(1)操作。对于’123’这样的字符串,zend会转换为其整数形式。$arr[‘123’]和$arr[123]是等价的

资源类型变量是PHP中最复杂的一种变量,也是一种复合型结构。

PHP的zval可以表示广泛的数据类型,但是对于自定义的数据类型却很难充分描述。由于没有有效的方式描绘这些复合结构,因此也没有办法对它们使用传统的操作符。要解决这个问题,只需要通过一个本质上任意的标识符(label)引用指针,这种方式被称为资源。

在zval中,对于resource,lval作为指针来使用,直接指向资源所在的地址。Resource可以是任意的复合结构,我们熟悉的mysqli、fsock、memcached等都是资源。

如何使用资源:

  • 注册:对于一个自定义的数据类型,要想将它作为资源。首先需要进行注册,zend会为它分配全局唯一标示。

  • 获取一个资源变量:对于资源,zend维护了一个id->实际数据的hash_tale。对于一个resource,在zval中只记录了它的id。fetch的时候通过id在hash_table中找到具体的值返回。

  • 资源销毁:资源的数据类型是多种多样的。Zend本身没有办法销毁它。因此需要用户在注册资源的时候提供销毁函数。当unset资源时,zend调用相应的函数完成析构。同时从全局资源表中删除它。

资源可以长期驻留,不只是在所有引用它的变量超出作用域之后,甚至是在一个请求结束了并且新的请求产生之后。这些资源称为持久资源,因为它们贯通SAPI的整个生命周期持续存在,除非特意销毁。很多情况下,持久化资源可以在一定程度上提高性能。比如我们常见的mysql_pconnect ,持久化资源通过pemalloc分配内存,这样在请求结束的时候不会释放。

对zend来说,对两者本身并不区分。

PHP中的局部变量和全局变量是如何实现的?对于一个请求,任意时刻PHP都可以看到两个符号表(symbol_table和active_symbol_table),其中前者用来维护全局变量。后者是一个指针,指向当前活动的变量符号表,当程序进入到某个函数中时,zend就会为它分配一个符号表x同时将active_symbol_table指向a。通过这样的方式实现全局、局部变量的区分。

获取变量值:PHP的符号表是通过hash_table实现的,对于每个变量都分配唯一标识,获取的时候根据标识从表中找到相应zval返回。

函数中使用全局变量:在函数中,我们可以通过显式申明global来使用全局变量。在active_symbol_table中创建symbol_table中同名变量的引用,如果symbol_table中没有同名变量则会先创建。

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

PHP 코어의 작동 메커니즘과 구현 원리에 대한 자세한 설명 PHP 코어의 작동 메커니즘과 구현 원리에 대한 자세한 설명 Nov 08, 2023 pm 01:15 PM

PHP는 웹 개발에 많이 사용되는 인기 있는 오픈 소스 서버 측 스크립팅 언어입니다. 동적 데이터를 처리하고 HTML 출력을 제어할 수 있지만 이를 달성하는 방법은 무엇입니까? 그런 다음 이 기사에서는 PHP의 핵심 작동 메커니즘과 구현 원리를 소개하고 특정 코드 예제를 사용하여 작동 프로세스를 자세히 설명합니다. PHP 소스코드 해석 PHP 소스코드는 C언어로 작성된 프로그램으로, 컴파일 후 php.exe라는 실행파일을 생성합니다. 웹 개발에 사용되는 PHP는 일반적으로 A를 통해 실행됩니다.

심층 분석: Go 언어의 고루틴의 본질과 작동 메커니즘 심층 분석: Go 언어의 고루틴의 본질과 작동 메커니즘 Mar 12, 2024 pm 03:39 PM

Go 언어에서 고루틴은 코드 조각을 동시에 실행하는 데 사용되는 경량 스레드입니다. 기존 스레드에 비해 고루틴은 더 효율적이고 메모리 소비가 적으며 시작 속도가 더 빠릅니다. 이 글에서는 Go 언어의 고루틴의 성격과 작동 메커니즘을 심층적으로 분석하고 독자의 이해를 돕기 위해 구체적인 코드 예제를 제공합니다. 1. 고루틴의 본질 Go 언어에서 고루틴은 Go 런타임에 의해 관리되는 경량 객체입니다.

Swoole에서 코루틴의 작동 메커니즘 살펴보기 Swoole에서 코루틴의 작동 메커니즘 살펴보기 Jun 13, 2023 am 10:27 AM

Swoole은 PHP 기반의 코루틴 프레임워크로 비동기 IO 성능이 뛰어납니다. Swoole의 핵심은 코루틴입니다. 코루틴은 스레드보다 더 가벼운 동시성 메커니즘으로, 동시 실행을 달성하기 위해 동일한 스레드에서 작업을 전환할 수 있습니다. 이 기사에서는 Swoole의 코루틴 작동 메커니즘을 살펴보겠습니다. 1. 코루틴의 개념 마이크로 스레드라고도 알려진 코루틴은 스레드보다 더 세분화된 동시성 메커니즘입니다. 코루틴과 스레드의 차이점은 코루틴은 타임 슬라이스 회전을 통해 작업 전환을 구현하는 반면 스레드는 운영 체제 스케줄러에 의해 전환된다는 것입니다.

Zend Framework 미들웨어의 작동 메커니즘과 원리를 이해합니다. Zend Framework 미들웨어의 작동 메커니즘과 원리를 이해합니다. Jul 28, 2023 pm 01:49 PM

ZendFramework 미들웨어의 작동 메커니즘과 원리를 이해합니다. 인터넷의 지속적인 발전으로 인해 웹 애플리케이션의 복잡성도 증가하고 있습니다. 이러한 문제를 해결하기 위해 미들웨어(Middleware)라는 개념이 탄생하게 되었습니다. 미들웨어는 매우 중요한 기술이며 ZendFramework에서도 널리 사용됩니다. 본 글에서는 ZendFramework 미들웨어의 작동 메커니즘과 원리를 소개하고, 샘플 코드를 통해 자세히 설명하겠습니다. 먼저 미들웨어란 무엇일까요? 미들웨어는 일종의

ApacheTomcat의 작동 원리와 작동 메커니즘을 분석합니다. ApacheTomcat의 작동 원리와 작동 메커니즘을 분석합니다. Jan 24, 2024 am 10:14 AM

ApacheTomcat은 Apache Software Foundation에서 개발하고 유지 관리하는 오픈 소스 JavaServlet 컨테이너입니다. Java 애플리케이션 개발에 가장 널리 사용되는 서블릿 컨테이너 중 하나이며 엔터프라이즈 수준 웹 애플리케이션 배포에 널리 사용됩니다. 이 기사에서는 Apache Tomcat의 원리와 작동 메커니즘을 자세히 분석하고 구체적인 코드 예제를 제공합니다. Tomcat의 아키텍처 Apache Tomcat은 여러 모듈로 구성된 구성 요소 기반 아키텍처를 채택합니다.

Tomcat 미들웨어의 작동 메커니즘과 내부 작동 원리에 대한 심층 분석 Tomcat 미들웨어의 작동 메커니즘과 내부 작동 원리에 대한 심층 분석 Dec 28, 2023 pm 01:20 PM

Tomcat 미들웨어의 운영 메커니즘 및 내부 작동 방식 해독 요약: Tomcat은 Java 웹 애플리케이션에서 널리 사용되는 오픈 소스 HTTP 서버이자 서블릿 컨테이너입니다. HTTP 요청 처리, 웹 애플리케이션 관리, 서블릿 라이프사이클 관리와 같은 풍부한 기능을 제공합니다. 이 기사에서는 Tomcat의 핵심 구성 요소 마스터링, 요청 처리 프로세스, 클래스 로딩 메커니즘, Servl을 포함하여 Tomcat 미들웨어의 작동 메커니즘과 내부 작동 원리를 깊이 탐구합니다.

Linux 커널 기능에 대한 자세한 설명: 다섯 가지 주요 부분에 대한 포괄적인 해석 Linux 커널 기능에 대한 자세한 설명: 다섯 가지 주요 부분에 대한 포괄적인 해석 Mar 21, 2024 am 08:18 AM

Linux 커널 기능에 대한 자세한 설명: 다섯 가지 주요 부분에 대한 포괄적인 설명 Linux 커널은 컴퓨터의 하드웨어 자원을 관리하고 프로세스 관리, 파일 시스템, 장치 드라이버와 같은 기능을 제공하는 오픈 소스 운영 체제 커널입니다. Linux 커널은 각각 특정 기능과 책임을 가진 다양한 부분으로 구성됩니다. 이 기사에서는 Linux 커널의 다섯 가지 주요 부분에 대한 포괄적인 설명을 제공하고 독자의 이해를 돕기 위해 구체적인 코드 예제를 제공합니다. 1. 프로세스 관리 프로세스 관리는 Linux 커널의 핵심 기능 중 하나이며 다음을 담당합니다.

코드를 작성하여 PHP8의 작동 메커니즘을 깊이 이해하는 방법 코드를 작성하여 PHP8의 작동 메커니즘을 깊이 이해하는 방법 Sep 12, 2023 pm 02:25 PM

코드 작성을 통해 PHP8의 작동 메커니즘을 깊이 이해하는 방법 소개: PHP8은 PHP 프로그래밍 언어의 차세대 주요 버전으로, 많은 새로운 기능과 개선 사항을 제공합니다. PHP8을 최대한 활용하려면 프로그래머는 PHP8의 작동 메커니즘을 깊이 이해해야 합니다. 코드를 작성하는 과정은 PHP8의 내부 작동 방식을 더 잘 이해하는 데 도움이 될 수 있습니다. 이 기사에서는 PHP8의 작동 메커니즘을 깊이 이해하는 데 도움이 되는 몇 가지 코딩 기술을 소개합니다. 1. PHP8의 새로운 기능을 이해하려면 먼저 PHP8을 이해해야 합니다.

See all articles