踩一坑，采一金之php数据类型那点“破”事-PHP 튜토리얼-php.cn

집

백엔드 개발

PHP 튜토리얼

踩一坑，采一金之php数据类型那点“破”事

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 23, 2016 pm 01:51 PM

php 데이터 유형

学海无涯，乘舟以渡之~

php边学边写差不多一年多点，php这种弱类型语言与之前接触的c、java、as3等语言还是挺不一样的，现在觉得很庆幸的是从c开始学编程，无论数据类型还是指针也好，至少有个基础的概念。

在php数据类型上踩了不少坑，也学到了一些东西，在这里分享一下，看源码可能会很枯燥，不过了解一些底层实现就好，后面不要再踩坑。

序、

之前在网上看到有比较热的帖子说：PHP的ip2long有bug，请慎用？于是看了下描述，大致如下

<?php echo ip2long('58.99.11.1'),"<br/>";   //输出是979569409 echo ip2long('58.99.011.1'),"<br>";  //输出是979568897 echo ip2long('058.99.11.1'),"<br>";  //输出是空

로그인 후 복사

看上面看似“一样”的IP地址，输出的结果“竟然”不一样。于是那个帖子得出结论：在 PHP 4.x,5.x 中 , 有前导零的 ip 转换的结果都不正确。

这货真的懂编程语言，真的懂数据类型么？

源码不贴了，在ext/standard/basic_functions.c文件中（5.3.28），无非就是直接调用c函数inet_pton或者inet_addr，然后调用ntohl转换一下字节序。不用多说，011有前导0表示8进制，于是011就变成了十进制9，所以58.99.11.1与58.99.011.1是不一样的，既然是8进制，绝不可能出现8吧，所以058.99.11.1不合法，当然也没办法转换为long，手册里写了，invalid会返回false，echo false当然显示为空，但是人家是false~所以没bug的。

注：Ip2long对于部分ip在32位会溢出，所以使用时一般使用sprintf(“%u”,)，注意一下就好了

一、intval

最大的值取决于操作系统。 32 位系统最大带符号的 integer 范围是 -2147483648 到 2147483647 。举例，在这样的系统上， intval ('1000000000000') 会返回 2147483647 。 64 位系统上，最大带符号的 integer 值是 9223372036854775807 。

$i = intval('2355200853');$j = intval(2355200853);var_dump($i);var_dump($j);int(2147483647) int(-1939766443)

로그인 후 복사

intval源码最终调用的是 convert_to_long_base函数，简单贴下部分源码（Zend/zend_operators.c）：

           switch (Z_TYPE_P(op)) {		case IS_NULL:			Z_LVAL_P(op) = 0;			break;		case IS_RESOURCE: {				TSRMLS_FETCH();				zend_list_delete(Z_LVAL_P(op));			}			/* break missing intentionally */		case IS_BOOL:		case IS_LONG:			break;		case IS_DOUBLE:			Z_LVAL_P(op) = zend_dval_to_lval(Z_DVAL_P(op));			break;		case IS_STRING:			{				char *strval = Z_STRVAL_P(op);				Z_LVAL_P(op) = strtol(strval, NULL, base);				STR_FREE(strval);			}			break;		case IS_ARRAY:			tmp = (zend_hash_num_elements(Z_ARRVAL_P(op))?1:0);			zval_dtor(op);			Z_LVAL_P(op) = tmp;			break;

로그인 후 복사

可以比较清晰的看到各种类型数据转换的结果，这里关注下double和string。如果类型是IS_DOUBLE使用了zend_dval_to_lval宏，这个宏在zend _operators.h中定义了，主要的含义就是

# define zend_dval_to_lval(d) ((long) (d))

로그인 후 복사

实际上这个宏还有其他分支，不过意思大致如此，对于long型已经溢出的double强转为long，结果与c中一样，溢出了。

如果类型是IS_STRING，直接调用c函数strtol，这个函数功能是：如果字符串中的整数值超出longint的表示范围（上溢或下溢），则strtol返回它所能表示的最大（或最小）整数。所以php的intval也就拥有了这些行为。

二、==

var_dump(in_array(0, array('s'))); var_dump(0 == "string");var_dump("1111" == "1112");var_dump("111111111111111111" == "111111111111111112");$str = 'string';var_dump($str['aaa']);32位bool(true) bool(true) bool(false) bool(true) string(1) "s" 64位bool(true)bool(true)bool(false)bool(false)string(1) "s"

로그인 후 복사

上面是很多人会对php弱类型举的一些例子，我加上了32位和64位的结果。

首先，每个基本上都基于php比较时的类型转换，是比较基础的知识。很多人看到这些结果也都会有点感慨~

var_dump("111111111111111111" == "111111111111111112");

로그인 후 복사

我很好奇的是这两个字符串比较为什么位true，当然在32位和64位机器结果不同，显然与转整型有关，在网上没看到其他人有解释，于是搜寻了下源码相关。大致如下：

==这个比较操作符，在比较两个字符串的时候，核心调用方法为ZEND_IS_EQUAL=>is_equal_function=>compare_function=>zendi_smart_strcmp

然后贴下zendi_smart_strcmp的源码，不是很长

ZEND_API void zendi_smart_strcmp(zval *result, zval *s1, zval *s2) /* {{{ */{	int ret1, ret2;	long lval1, lval2;	double dval1, dval2;	if ((ret1=is_numeric_string(Z_STRVAL_P(s1), Z_STRLEN_P(s1), &lval1, &dval1, 0)) &&		(ret2=is_numeric_string(Z_STRVAL_P(s2), Z_STRLEN_P(s2), &lval2, &dval2, 0))) {		if ((ret1==IS_DOUBLE) || (ret2==IS_DOUBLE)) {			if (ret1!=IS_DOUBLE) {				dval1 = (double) lval1;			} else if (ret2!=IS_DOUBLE) {				dval2 = (double) lval2;			} else if (dval1 == dval2 && !zend_finite(dval1)) {				/* Both values overflowed and have the same sign,				 * so a numeric comparison would be inaccurate */				goto string_cmp;			}			Z_DVAL_P(result) = dval1 - dval2;			ZVAL_LONG(result, ZEND_NORMALIZE_BOOL(Z_DVAL_P(result)));		} else { /* they both have to be long's */			ZVAL_LONG(result, lval1 > lval2 ? 1 : (lval1   <p></p>  <p>   其中is_numeric_string是zend_operators.h中的一个inline函数，判断字符串是不是数字，并且返回IS_LONG或者IS_DOUBLE类型，其中决定是long还是double比较关键的点是源码中的digits >= MAX_LENGTH_OF_LONG，那么MAX_LENGTH_OF_LONG又是个什么东西？</p>  <p>   在zend.h中有这个宏定义</p>  <p></p>  <pre name="code" class="sycode">#if SIZEOF_LONG == 4#define MAX_LENGTH_OF_LONG 11static const char long_min_digits[] = "2147483648";#elif SIZEOF_LONG == 8#define MAX_LENGTH_OF_LONG 20static const char long_min_digits[] = "9223372036854775808";#else#error "Unknown SIZEOF_LONG"#endif

로그인 후 복사

大致明白了，对于32位机器long型是4字节，64位机器long型是8字节，原来差别在这里！当然也预定义了个长度，11和20两个我觉得挺magic的number。

好，上面那个那么多个1的字符串在32位机器上显然就是IS_DOUBLE了，接下来有个分支zend_finite判断是否是有限值，其实这些现在看都不是很重要，最重要的一句话是

Z_DVAL_P(result) = dval1 - dval2;ZVAL_LONG(result, ZEND_NORMALIZE_BOOL(Z_DVAL_P(result)));

로그인 후 복사

其中ZEND_NORMALIZE_BOOL宏是用来标准化bool值的

#define ZEND_NORMALIZE_BOOL(n)			\	((n) ? (((n)>0) ? 1 : -1) : 0)

로그인 후 복사

好，dval1-dval2究竟是什么呢，这时要想到double型的有效位数了，C里double型有效位数大概16位，上面那个字符串是18个1，已经超出了有效位数，做减法已经不会准确了，这里不想去深究double型的表示，简单用c语言展示一下。

#include <stdio.h>int main() {double a = 11111 11111 11111 12.0L;double b = 11111111111111111.0L;double c= 11111111111111114.0L;printf("%lf" , a-b);printf("%d" , a-b == 0);printf("%lf" , c-b);printf("%d" , c-b == 0);}</stdio.h>

로그인 후 복사

对于这样一个c程序，输出结果为

0.00000012.0000000

로그인 후 복사

在32位机器与64位机器上相同，因为double型都是8字节。

可以试一下，尾数1、2、3相减都是0，到了尾数为4才会发生变化，结果也不精确，下面看下内存中表示：

double c = 11111111111111111.0L;double d = 11111111111111112.0L;double e = 11111111111111113.0L;double f = 11111111111111114.0L;double *p = &c;printf("%x, %x\n" , ((int *)p)[0], ((int *)p)[1]);p = &d;printf("%x, %x\n" , ((int *)p)[0], ((int *)p)[1]);p = &e;printf("%x, %x\n" , ((int *)p)[0], ((int *)p)[1]);p = &f;printf("%x, %x\n" , ((int *)p)[0], ((int *)p)[1]);

로그인 후 복사

其实就是将double型强转位int数组，然后转16进制输出，结果为：

936b38e4, 4343bcbf936b38e4, 4343bcbf936b38e4, 4343bcbf936b38e5, 4343bcbf

로그인 후 복사

可以看到尾数为4的那位不太一样，结合上面，这就是为什么

var_dump("111111111111111111" == "111111111111111112");

로그인 후 복사

在32位机器结果为true的原因，4字节溢出转成double，然后相减不精确了，变成了0，导致相等。64位机器因为没溢出，所以为false。

三、array_flip

在32位机器上，使用企业QQ号码做关联数组key的时候，需要注意大于21亿的问题

32位$a = array(2355199999 => 1, 2355199998 => 1);var_dump($a);array(2) { [-1939767297]=> int(1) [-1939767298]=> int(1) } $b = array(2355199999, 2355199998);var_dump($b);array(2) { [0]=> float(2355199999) [1]=> float(2355199998) } var_dump(array_flip($b));Warning: array_flip() Can only flip STRING and INTEGER values!$c = array();foreach($b as $key => $value) {    $c[$value] = $key;}var_dump($c);

로그인 후 복사

因为key只能为string或者interger，在32位机器上，大于21亿就成为了float，所以如果强行拿float去做key，会溢出变成类似负数等等~这里如果将大于21亿的数加上引号才可以

四、array_merge

简单说下，array_merge在文档上有写明，如果key为整数，merge后key会成为按照自然数重新排列

例如

<?php $a = array(5 => 5, 7 => 4);$b = array(1 => 1, 9 => 9);var_dump(array_merge($a, $b));

로그인 후 복사

输出是array(4) { [0]=> int(5) [1]=> int(4) [2]=> int(1) [3]=> int(9)}

源码实现比较简单，我也看过，就是碰到整数就使用nextindex，碰到字符串就正常insert。

于是在32位机器上，如果key大于21亿的话，array_merge不会将key使用nextindex变成自然数重新排，在64位机上当然大于21亿也没有用~

所以如果key为整数，合并数组的时候可以使用array+array这样代替。

array_merge($a, $b)的时候如果字符串key相同，$b会覆盖$a，如果key为32位或者64位long整数范围内，则不会覆盖，因为实现的时候是简单的遍历覆盖插入hashtable。

array+array如果key相同，是保留前者，抛弃后者。

结、

我很庆幸第一门语言学的是c语言，虽然本科懵懂的简单代码写的挺溜，各种技术了解比较少，但是有了c语言及一些c++的基础，研究其他语言还是会容易很多，能够揣摩到一些底层实现原理，当然底层原理还是要再深入的学习。

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7467

Cakephp 튜토리얼

1376

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

Ubuntu 및 Debian용 PHP 8.4 설치 및 업그레이드 가이드 Dec 24, 2024 pm 04:42 PM

PHP 8.4는 상당한 양의 기능 중단 및 제거를 통해 몇 가지 새로운 기능, 보안 개선 및 성능 개선을 제공합니다. 이 가이드에서는 Ubuntu, Debian 또는 해당 파생 제품에서 PHP 8.4를 설치하거나 PHP 8.4로 업그레이드하는 방법을 설명합니다.

CakePHP 날짜 및 시간 Sep 10, 2024 pm 05:27 PM

cakephp4에서 날짜와 시간을 다루기 위해 사용 가능한 FrozenTime 클래스를 활용하겠습니다.

CakePHP 파일 업로드 Sep 10, 2024 pm 05:27 PM

파일 업로드 작업을 위해 양식 도우미를 사용할 것입니다. 다음은 파일 업로드의 예입니다.

CakePHP 토론 Sep 10, 2024 pm 05:28 PM

CakePHP는 PHP용 오픈 소스 프레임워크입니다. 이는 애플리케이션을 훨씬 쉽게 개발, 배포 및 유지 관리할 수 있도록 하기 위한 것입니다. CakePHP는 강력하고 이해하기 쉬운 MVC와 유사한 아키텍처를 기반으로 합니다. 모델, 뷰 및 컨트롤러 gu

CakePHP 유효성 검사기 만들기 Sep 10, 2024 pm 05:26 PM

컨트롤러에 다음 두 줄을 추가하면 유효성 검사기를 만들 수 있습니다.

CakePHP 로깅 Sep 10, 2024 pm 05:26 PM

CakePHP에 로그인하는 것은 매우 쉬운 작업입니다. 한 가지 기능만 사용하면 됩니다. cronjob과 같은 백그라운드 프로세스에 대해 오류, 예외, 사용자 활동, 사용자가 취한 조치를 기록할 수 있습니다. CakePHP에 데이터를 기록하는 것은 쉽습니다. log() 함수는 다음과 같습니다.