php的二进制安全
php的二进制安全
本文主要从三个角度来阐述php的二进制安全:1. 什么叫php的二进制安全;2. 什么结构确保了php的二进制安全;3. 这种结构还有哪些其它方面的应用?
做到知其然,也知其所以然。
一句话解释:
php的内部函数在操作二进制数据时能保证达到预期的结果,例如str_replace、stristr、strcmp等函数,我们就说这些函数是二进制安全的。
举个列子:
我们来对比一下C和php下的strcmp函数。
C代码如下
main(){ char ab[] = "aa\0b"; char ac[] = "aa\0c"; printf("%d\n", strcmp(ab, ac)); printf("%d\n", strlen(ab));  }
结果:
0
2
解读:
也就是说C语言认为ab和ac这两个字符串是相等的,而且ab的长度为2.
php代码如下
<?php $ab = "aa\0b"; $ac = "aa\0c"; var_dump(strcmp($ab, $ac)); var_dump(strlen($ab));  ?>
int(-1)
int(4)
解读:
也就是php语言认为ab和ac这两个字符串是相等的,而且ab的长度为4。
聪明的你,应该已经发现问题在哪了吧,不错,对于c语言‘\0’是字符串的结束符,所以在C语言中对于字符串“aa\0b”,它读到'\0'就会默认字符读取已经结束,而抛掉后面的字符串'b',导致我们看到strlen(“aa\0b”)的值为2
那问题又来了,php都是C来开发的,为什么php做到了二进制安全呢?
先来看看php的变量存储zval结构
php会根据type的值来决定访问value的哪个成员,为字符串时,我们会访问红框标识的str结构,这便是底层字符串的存储结构,它有两个值,一个是指向字符串的指针val,另一个是记录字符串长度的len值,就是因为有len这个值,导致了php是二进制安全的:因为它不需要像C一样通过是否遇到'\0'结尾符来判断整个字符串是否读取完毕,而是通过len这个值指定的长度进行读取。
可见一个小小的数据结构改进,为我们带来了更多想象的空间,可谓是结构的一小步,功能的一大步。
拓展:
这么好用的结构,显然会被到处使用,我们常用的redis,在底层存储数据时就用到了这种结构,Redis 没有直接使用 C 语言传统的字符串表示(以空字符结尾的字符数组),而是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型,并将 SDS 用作 Redis 的默认字符串表示
看下SDS的结构定义
struct sdshdr { // 记录 buf 数组中已使用字节的数量 // 等于 SDS 所保存字符串的长度 int len; // 记录 buf 数组中未使用字节的数量 int free; // 字节数组,用于保存字符串 char buf[]; };
以下内容足以阐明这一点:(摘自http://redisbook.com/preview/sds/different_between_sds_and_c_string.html#id6)
C 字符串中的字符必须符合某种编码(比如 ASCII),并且除了字符串的末尾之外,字符串里面不能包含空字符,否则最先被程序读入的空字符将被误认为是字符串结尾 ——这些限制使得 C 字符串只能保存文本数据,而不能保存像图片、音频、视频、压缩文件这样的二进制数据。
举个例子,如果有一种使用空字符来分割多个单词的特殊数据格式,如图 2-17 所示,那么这种格式就不能使用 C 字符串来保存,因为 C 字符串所用的函数只会识别出其中的
"Redis"
,而忽略之后的
"Cluster"
。
虽然数据库一般用于保存文本数据,但使用数据库来保存二进制数据的场景也不少见,因此,为了确保 Redis 可以适用于各种不同的使用场景,SDS 的 API 都是二进制安全的(binary-safe):所有 SDS API 都会以处理二进制的方式来处理 SDS 存放在
buf
数组里的数据,程序不会对其中的数据做任何限制、过滤、或者假设 ——数据在写入时是什么样的,它被读取时就是什么样。
这也是我们将 SDS 的 buf
属性称为字节数组的原因 ——Redis 不是用这个数组来保存字符,而是用它来保存一系列二进制数据。
比如说,使用 SDS 来保存之前提到的特殊数据格式就没有任何问题,因为 SDS 使用 len
属性的值而不是空字符来判断字符串是否结束,如图 2-18 所示。
buf"]; buf [label = " { 'R' | 'e' | 'd' | 'i' | 's' | '\\0' | 'C' | 'l' | 'u' | 's' | 't' | 'e' | 'r' | '\\0' | '\\0' } "]; // sdshdr:buf -> buf;}">
通过使用二进制安全的 SDS ,而不是 C 字符串,使得 Redis 不仅可以保存文本数据,还可以保存任意格式的二进制数据。

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

二進位演算法是一種基於二進制數的運算方法,其基本運算包括加法、減法、乘法和除法。除了基本運算外,二進位演算法還包括邏輯運算、位移運算等操作。邏輯運算包括與、或、非等操作,位移運算包括左移和右移操作。這些操作都有對應的規則和操作數的要求。

二進制數以1和0表示。 16位元的十六進位數係統為{0,1,2,3…..9,A(10),B(11),……F(15)}為了從二進位表示轉換為十六進位表示,位元串id被分組為4位元區塊,從最低有效側開始稱為半位元組。每個區塊都替換為相應的十六進制數字。讓我們看一個範例,以清楚地了解十六進制和二進制數字表示。 001111100101101100011101 3 E 5 B&nb

EDVAC的兩個重大的改進:一是採用二進制,二是完成了存貯程序,可以自動地從一個程序指令進到下一個程序指令,其作業可以透過指令自動完成。 「指令」包括資料和程序,把它們用碼的形式輸入到機器的記憶裝置中,即用記憶資料的同一記憶裝置存貯執行運算的命令,這就是所謂存貯程序的新概念。

Golang如何讀取二進位檔案?二進位檔案是以二進位形式儲存的文件,其中包含了電腦能夠識別和處理的資料。在Golang中,我們可以使用一些方法來讀取二進位文件,並將其解析成我們想要的資料格式。以下將介紹如何在Golang中讀取二進位文件,並給出具體的程式碼範例。首先,我們需要使用os包中的Open函數開啟二進位文件,這將會傳回一個文件物件。然後,我們可以使

電腦採用二進位的主要原因:1、電腦是由邏輯電路組成,邏輯電路通常只有兩個狀態,開關的接通與斷開,這兩種狀態剛好可以用「1」與「0」表示;2、二進位只使用0和1兩個數字,傳輸和處理時不易出錯,因而可以保障電腦具有很高的可靠性。

題目:輕鬆學會Go語言中16進制轉二進制,需要具體程式碼範例在電腦程式設計中,經常會涉及到對不同進制數之間的轉換操作。其中,16進位和二進位之間的轉換是比較常見的。在Go語言中,我們可以透過一些簡單的程式碼範例來實現16進位到二進位的轉換,讓我們一起來學習一下。首先,我們來了解16進位和二進位的表示方法。 16進位是一種表示數字的方法,使用0-9和A-F來表示1

Golang能否處理二進位檔案?在Go語言中,處理二進位檔案是非常常見且方便的。透過使用內建的套件和方法,我們可以輕鬆地讀取、寫入和操作二進位檔案。本文將介紹如何在Go中處理二進位文件,並提供具體的程式碼範例。讀取二進位檔案要讀取一個二進位文件,我們首先需要開啟這個檔案並建立一個對應的檔案物件。然後,我們可以使用Read方法從檔案中讀取數據,並以位元組的形式儲存在
