串行化大概就是把一些变量转化成为字符串的字节流的形式,这样比较容易传输、存储。当然,关是传输存储没有什么,关键是变成串的形式以后还能够转化回来,而且能够保持原来数据的结构。
在PHP中有多串行化处理的函数:serialize(),该函数把任何变量值(除了资源变量)转化为字符串的形式,可以把字符串保存到文件里,或者注册为Session,乃至于使用curl来模拟GET/POST来传输变量,达到RPC的效果。
如果要将串行化的变量转化成PHP原始的变量值,那么可以使用unserialize()函数。
一、变量串行化
我们举简单的例子来说明串行化,以及它的存储格式。
整型:
$var = 23;
echo serialize($var);
输出:
i:23;
浮点型:
$var = 1.23;
echo serialize($var);
输出:
d:1.229999999999999982236431605997495353221893310546875;
字符串:
$var = "This is a string";
echo serialize($var);
$var = "我是变量";
echo serialize($var);
输出:
s:16:"This is a string";
s:8:"我是变量";
布尔型:
$var = true;
echo serialize($var);
$var = false;
echo serialize($var);
输出:
b:1;
b:0;
上面这些基本类型串行化之后的情况很清楚,串行化之后的存储格式是:
变量类型:[变量长度:]变量值;
就是第一位字符代表变量类型,第二个:代表分割,变量长度是可选的,就是在字符串类型里有,其他类型没有,最后一个就是变量值,每个串行化的值以";"作为结束。
比如我们整型数字23串行化之后就是:i:23,那么它没有长度,只有类型和变量值,i代表integer,通过冒号分割,后面保存的是整型值23,包括浮点型(双字节型)也是一样。布尔型的话,类型是b(boolean),如果是true的话,那么串行化的值是1,如果是false那么值就是0。字
符串值话中间会多一个保存的值得,保存字符串的长度值,比如字符串"This is a string",那么生成的串行化的值是 s:16:"This is a string"; s是string,代表类型,中间的16就是该字符串的长度,如果是中文的话,那么每个中文是两个字符来保存的,比如字符串 "我是变量",生成的串行化值是:s:8:"我是变量"; 就是8个字符的长度。
下面我们重点来讲一下数组变量串行化。
数组变量:
$var = array("abc", "def", "xyz", "123");
echo serialize($var);
输出:
a:4:{i:0;s:3:"abc";i:1;s:3:"def";i:2;s:3:"xyz";i:3;s:3:"123";}
就是把我的数组 $var 串行化得到的字符串值,我们的$var数组包括4个字符串元素,分别是"abc", "def", "xyz", "123",我们来分析一下串行化后的数据,为了简便起见,我们把串行化的数据列成数组的样式:
a:4:
{
i:0;s:3:"abc";
i:1;s:3:"def";
i:2;s:3:"xyz";
i:3;s:3:"123";
}
这样排列就比较清晰了,看开始的字符串:a:4:{...} 首先第一个字符a保存的是变量类型是array(数组)类型,第二个 4 保存的是数组元素的个数,一共有4个,然后在{}之间数组元素的内容。比如第一个数组元素:i:0;s:3:"abc"; i代表是当前数组元素的索引值类型是整型,并且值是 0,元素值的类型是s(字符串的),个数是 3 个,具体值是"abc",分号结束,下面的数组元素依次类推。
我们再看看使用字符串做为元素索引会如何:
$var = array("index1"=>"abc", "index2"=>"def", "index3"=>"xyz", "index4"=>"123");
echo serialize($var);
输出:
a:4:{s:6:"index1";s:3:"abc";s:6:"index2";s:3:"def";s:6:"index3";s:3:"xyz";s:6:"index4";s:3:"123";}
变成数组样式后:
a:4:
{
s:6:"index1";s:3:"abc";
s:6:"index2";s:3:"def";
s:6:"index3";s:3:"xyz";
s:6:"index4";s:3:"123";
}
其实跟上面没有太大区别,不过是开始的索引变成了保存字符串的形式,比如第一个元素:s:6:"index1";s:3:"abc";第一项就是索引值:s:6:"index1"; s是类型,6是索引字符串的长度,"index1"就是索引的值。后面的s:3:"abc"; 就是元素值,这个好理解,就不讲了。
从上面来看,我们大致了解了基本数据类型的串行化,其实我们完全可以构造自己的串行化功能,或者从这个角度去扩展,开发自己的串行化程序,便于我们的变量交换。
もちろん、この関数を使用して配列またはその他の変数を文字列にシリアル化し、curl 関数を使用して GET/POST 関数をシミュレートし、ユーザーがアクションを実行せずにリモート サーバーからデータを取得することもできます。
2. オブジェクトのシリアル化
オブジェクトのシリアル化も比較的一般的な機能で、オブジェクトをシリアル化して文字列に変換し、保存したり送信したりできます。
まずは例を見てみましょう:
クラスTestClass
{
var $a;
var $b;
function TestClass()
{
$this->a = "これはa";
$this->b = "これはb";
}
function getA()
{
return $this->a;
}
function getB()
{
return $this->b;
}
}
$obj = 新しい TestClass;
$str = シリアライズ($obj);
echo $str;
O:9:"TestClass":2:{s:1:"a";s:9:"これは a";s:1:"b";s:9:"これは b";}
オブジェクトをシリアル化した後の文字列を解析してみましょう。
O:9:"TestClass":2:
{
s:1:"a";s:9:"これはa";
s:1:"b";s:9:"これはb" ;
}
s:1:"a";s:9:"This is a"; 実際には、最初の項目は属性名を記述します。 2 番目の項目 s: 9: "This is a"; は属性値を説明します。次のプロパティも同様です。
まず、オブジェクトのシリアル化の応用について説明します。以下の内容は PHP マニュアルからのものであり、原文は変更されていません。
serialize() は、PHP に格納できる任意の値のバイト ストリーム表現を含む文字列を返します。 unserialize() は、この文字列を使用して元の変数値を再構築できます。シリアル化を使用してオブジェクトを保存すると、オブジェクト内のすべての変数が保存されます。オブジェクト内の関数は保存されず、クラス名のみが保存されます。
オブジェクトを unserialize() できるようにするには、オブジェクトのクラスを定義する必要があります。つまり、page1.php でクラス A のオブジェクト $a をシリアル化すると、クラス A を指し、$a 内のすべての変数の値を含む文字列が得られます。それを page2.php で逆シリアル化し、クラス A のオブジェクト $a を再構築したい場合は、クラス A の定義が page2.php に存在する必要があります。これは、たとえば、クラス A の定義をインクルード ファイルに配置し、このファイルを page1.php と page2.php の両方にインクルードすることで実現できます。
<?php
// classa.inc:
class A
{
var $one = 1;
{
echo $this->one;
}
}
include("classa.inc");
$s = Serialize($a);
// page2.php が見つけられるように $s をどこかに保存します
$fp = fopen("store", "w");
fputs ($ fp, $s);
fclose($fp);
// この行は通常の逆シリアル化に必要です
include("classa.inc");
$a = unserialize($s);
$a->show_one();
?>
これらの登録されたオブジェクトのクラスの定義を、すべてのページで使用されない場合でも、すべてのページに含めることを強くお勧めします。これが行われず、オブジェクトがそのクラス定義なしで逆シリアル化されると、そのオブジェクトは関連付けられたクラスを失い、使用可能な関数がまったくない stdClass のオブジェクトになり、非常に役に立ちません。
つまり、上記の例で session_register("a") を実行して $a がセッションの一部になった場合、classa.inc ファイルは、page1.php と page2.php だけでなく、すべてのページに含まれる必要があります。
もちろん、シリアル化されたオブジェクトは実際にさまざまな場所に適用できます。もちろん、PHP 5 ではシリアル化の処理方法が異なります。マニュアルの内容を見てみましょう:
Serialize()はクラス内に__sleepというマジック名を持つ関数があるかどうかをチェックします。その場合、関数はシリアル化の前に実行されます。これはオブジェクトをクリアし、シリアル化する必要があるオブジェクト内のすべての変数の名前を含む配列を返す必要があります。
__sleep を使用する目的は、オブジェクトが持つデータベース接続を閉じたり、保留中のデータを送信したり、同様のクリーンアップ タスクを実行したりすることです。さらに、この機能は、完全に保存する必要のない非常に大きなオブジェクトがある場合に便利です。
対照的に、unserialize() は、__wakeup というマジック名を持つ関数の存在を確認します。この関数は、オブジェクトが持つ可能性のあるリソースが存在する場合、それを再構築できます。
__wakeup を使用する目的は、シリアル化中に失われた可能性のあるデータベース接続を再確立し、他の再初期化タスクを処理することです。 。