ホームページ バックエンド開発 PHPチュートリアル 自家製バイナリ「データベース」をパック、アンパックする

自家製バイナリ「データベース」をパック、アンパックする

Aug 08, 2016 am 09:30 AM
array this

引言

pack、unpack函数,如果没有接触过socket,这个可能会比较陌生,这两个函数在socket交互的作用是组包,将数据装进一个二进制字符串,和对二进制字符串中的数据进行解包,这个里面有好多种格式,具体的格式可以去查查官方的手册(或者等看完本篇文章之后,去调用接口查看),我这里主要用了pack(“N”,int),pack(“a”,str)以及他们两个对应的解包函数,N在手册中的解释是下面这个,占4个字节,大端方式(其实就是低位在前还是在后的问题)。a是对字符串进行打包,不够指定的数值的时候用NULL(\0,或者说assic码0对应的字符)填充。

N - unsigned long (always 32 bit, big endian byte order)

a - NUL-padded string

我将用这个打包解包函数做一个函数手册查询小工具,或者可以说是一个自制小型二进制数据库。

设计数据格式

在做这个二进制文件数据库的时候我会创建两个文件,一个是索引文件,一个是要查询的数据的文件,分别看看他们的结构:

说明中括号内的数字为所占字节(bytes)数,"~"波浪线表示所占字节数不确定

数据文件,第一个php是一个正式的字符串"php",占4个字节,后面跟着版本说明,长度不确定(这个长度可以从后面的index文件中获取),接下来后面是存储信息的主体了。首先是一个函数名长度lenName占4个字节,接下来是函数名称,长度不确定,有前面的lenName对应的值确定,接下来是lenVal占4个字节,后面跟的是具体的函数说明内容,长度有前面的lenVal对应的值确定。

<span>          内容存储格式定义
</span>++++++++++++++++++++++++++++++++++++++
|php(<span>4</span>)        |版本说明(~)           |
++++++++++++++++++++++++++++++++++++++
|lenName(<span>4</span>)    |函数名称(~)           |
++++++++++++++++++++++++++++++++++++++
|lenVal(<span>4</span>)     |函数内容(~)           |
++++++++++++++++++++++++++++++++++++++<span>
            ......</span>
ログイン後にコピー

索引文件,索引文件就比较简单了,其中全部存储了上面的存储文件中每个函数开始的指针位置,每个位置占用4个字节。

<span>索引格式定义
</span>++++++++++++++++++++++++++++++++++++++
|position(<span>4</span>)                         |
++++++++++++++++++++++++++++++++++++++<span>
            ......</span>
ログイン後にコピー

查询的实现

由于存储文件中的内容是按照函数名顺序排序存储的,索引也是按照函数存储的顺序存储的,所以获取起来很方便,直接使用二分法就可以很轻松的获取到想要的函数

在查询的时候主要使用了下面几个方法:

第一、从制定位置获取一条索引的值(也就是对应的函数存储文件的指针位置)

<span>/*</span><span>*
 * 从索引文件中获取一条记录的位置
 * @param 索引文件中的开始位置,从开始位置获取四个字节为一个函数说明的开始位置
 * @return 返回该索引位置所对应的存储位置指针偏移量
 </span><span>*/</span>
<span>private</span> <span>function</span> _getOneIndex(<span>$pos</span><span>)
{
    </span><span>fseek</span>(<span>$this</span>->_indexHandle, <span>$pos</span><span>);
    </span><span>$len</span> = <span>unpack</span>("Nlen", <span>fread</span>(<span>$this</span>->_indexHandle, 4<span>));
    </span><span>return</span> <span>$len</span>['len'<span>];
}</span>
ログイン後にコピー

第二、从指定的指针偏移位置获取一条len(4)+val(~)格式的内容

<span>/*</span><span>*
 * 从制定的指针偏移量获取一个len+val型的内容
 * @param $pos 文件的指针偏移量
 * @return 返回数组,包括长度和值
 </span><span>*/</span>
<span>private</span> <span>function</span> _getStoreLenValFormat(<span>$pos</span><span>){
    </span><span>fseek</span>(<span>$this</span>->_storeHandle, <span>$pos</span><span>);
    </span><span>$len</span> = <span>unpack</span>("Nlen", <span>fread</span>(<span>$this</span>->_storeHandle, 4<span>));
    </span><span>$len</span> = <span>$len</span>['len'<span>];
    </span><span>$val</span> = <span>fread</span>(<span>$this</span>->_storeHandle, <span>$len</span><span>);
    </span><span>return</span> <span>array</span><span>
    (
        </span>'len' => <span>$len</span>,
        'value' => <span>$val</span>,<span>
    );
}</span>
ログイン後にコピー

第三、获取制定函数的说明,这个也是最主要的一部分,使用二分法从数据文件中获取一条记录

<span>/*</span><span>*
 * 获取函数内容
 * @param 要查找的函数名称
 * @return 返回函数说明的json字符串
 </span><span>*/</span>
<span>public</span> <span>function</span> get(<span>$func</span><span>)
{
    </span><span>if</span>(!<span>$this</span>-><span>isInit())
        </span><span>return</span><span>;
    </span><span>$begin</span> = 0<span>;
    </span><span>$end</span> = <span>filesize</span>(<span>$this</span>->_indexFile)/4<span>;
    </span><span>$ret</span> = '[]'<span>;
    </span><span>while</span>(<span>$begin</span> < <span>$end</span><span>){
        </span><span>$mid</span> = <span>floor</span>((<span>$begin</span> + <span>$end</span>)/2<span>);
        </span><span>$pos</span> = <span>$mid</span>*4<span>; //$mid只是指针变量的位置,还需要乘上指针的长度4
        </span><span>$pos</span> = <span>$this</span>->_getOneIndex(<span>$pos</span><span>);
        </span><span>$name</span> = <span>$this</span>->_getStoreLenValFormat(<span>$pos</span><span>);
        </span><span>$flag</span> = <span>strcmp</span>(<span>$func</span>, <span>$name</span>['value'<span>]);
        </span><span>if</span>(<span>$flag</span> == 0<span>){
            </span><span>$val</span> = <span>$this</span>->_getStoreLenValFormat(<span>$pos</span>+4+<span>$name</span>['len'<span>]);
            </span><span>$ret</span> = <span>$val</span>['value'<span>];
            </span><span>break</span><span>;
        }</span><span>elseif</span>(<span>$flag</span> < 0<span>){
            </span><span>$end</span> = <span>$end</span> == <span>$mid</span> ? <span>$mid</span>-1 : <span>$mid</span><span>;
        }</span><span>else</span><span>{
            </span><span>$begin</span> = <span>$begin</span> == <span>$mid</span> ? <span>$mid</span>+1 : <span>$mid</span><span>;
        }
    }
    </span><span>return</span> <span>$ret</span><span>;
}</span>
ログイン後にコピー

使用很简单,只需包含类库文件和存储文件数据库,然后调用几句代码就可以

<?<span>php
</span><span>include_once</span>("./manual/phpManual.php"<span>);

</span><span>$t</span> = <span>new</span><span> phpManual();
</span><span>$t</span>->init('zh'<span>);
</span><span>echo</span> <span>$t</span>->get("unpack");
ログイン後にコピー

输出的是json字符串,转化后如下所示,其中有详细的说明,以及简洁的例子

<span>{
    </span>"name": "unpack"<span>,
    </span>"desc": "Unpack data from binary string."<span>,
    </span>"long_desc": "Unpacks from a binary string into an array according to the given `format`.\\n\\nThe unpacked data is stored in an associative array. To accomplish this you have to name the different format codes and separate them by a slash /. If a repeater argument is present, then each of the array keys will have a sequence number behind the given name."<span>,
    </span>"ver": "PHP 4, PHP 5"<span>,
    </span>"ret_desc": "Returns an associative array containing unpacked elements of binary string."<span>,
    </span>"seealso"<span>: [
        </span>"pack"<span>
    ],
    </span>"url": "function.unpack"<span>,
    </span>"class": <span>null</span><span>,
    </span>"params"<span>: [
        {
            </span>"list"<span>: [
                {
                    </span>"type": "string"<span>,
                    </span>"var": "$format"<span>,
                    </span>"beh": 0<span>,
                    </span>"desc": "See pack() for an explanation of the format codes."<span>
                },
                {
                    </span>"type": "string"<span>,
                    </span>"var": "$data"<span>,
                    </span>"beh": 0<span>,
                    </span>"desc": "The packed data."<span>
                }
            ],
            </span>"ret_type": "array"<span>
        }
    ],
    </span>"examples"<span>: [
        {
            </span>"title": "unpack() example"<span>,
            </span>"source": "$binarydata = \"\\x04\\x00\\xa0\\x00\";\n$array = unpack(\"cchars/nint\", $binarydata);"<span>,
            </span>"output": <span>null</span><span>
        },
        {
            </span>"title": "unpack() example with a repeater"<span>,
            </span>"source": "$binarydata = \"\\x04\\x00\\xa0\\x00\";\n$array = unpack(\"c2chars/nint\", $binarydata);"<span>,
            </span>"output": <span>null</span><span>
        },
        {
            </span>"title": "unpack() example with unnamed keys"<span>,
            </span>"source": "$binarydata = \"\\x32\\x42\\x00\\xa0\";\n$array = unpack(\"c2/n\", $binarydata);\nvar_dump($array);"<span>,
            </span>"output": <span>null</span><span>
        }
    ]
}</span>
ログイン後にコピー

最后再附上目录结构:

+<span>phpManual
    </span>+<span>manual
        </span>+<span>phpManual
            </span>+<span>zh
                </span>|<span>_manualIndex
                </span>|<span>_manualStore
        </span>|<span>_phpManual.php
    </span>|_test.php
ログイン後にコピー

这个是程序的完整地址:

完整例子地址

参考

https://github.com/aizuyan/php-doc-parser 从这里拿到的phpmanual的全部数据

  

本文版权归作者iforever(luluyrt@163.com)所有,未经作者本人同意禁止任何形式的转载,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。

以上就介绍了pack、unpack自制二进制“数据库”,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

C# の Array.Sort 関数を使用して配列を並べ替える C# の Array.Sort 関数を使用して配列を並べ替える Nov 18, 2023 am 10:37 AM

タイトル: Array.Sort 関数を使用して C# で配列を並べ替える例 本文: C# では、配列は一般的に使用されるデータ構造であり、多くの場合、配列を並べ替える必要があります。 C# には Array クラスが用意されており、このクラスには配列を簡単に並べ替えるための Sort メソッドがあります。この記事では、C# で Array.Sort 関数を使用して配列を並べ替える方法を示し、具体的なコード例を示します。まず、Array.Sort 関数の基本的な使用法を理解する必要があります。 Array.So

PHPのarray_merge_recursive()関数を使用するシンプルで明確な方法 PHPのarray_merge_recursive()関数を使用するシンプルで明確な方法 Jun 27, 2023 pm 01:48 PM

PHP でプログラミングする場合、多くの場合、配列をマージする必要があります。 PHP には、配列のマージを完了するための array_merge() 関数が用意されていますが、配列内に同じキーが存在する場合、この関数は元の値を上書きします。この問題を解決するために、PHP は配列をマージして同じキーの値を保持できる array_merge_recursive() 関数を言語で提供し、プログラム設計をより柔軟にします。配列マージ

PHP で array_combine 関数を使用して 2 つの配列を結合して連想配列にする方法 PHP で array_combine 関数を使用して 2 つの配列を結合して連想配列にする方法 Jun 26, 2023 pm 01:41 PM

PHP には、配列操作をより便利かつ高速にする強力な配列関数が多数あります。 2 つの配列を結合して連想配列にする必要がある場合、PHP の array_combine 関数を使用してこの操作を実行できます。この関数は、実際には、ある配列のキーを別の配列の値として新しい連想配列に結合するために使用されます。次に、PHP の array_combine 関数を使用して 2 つの配列を結合して連想配列にする方法を説明します。 array_comb について学ぶ

PHPのarray_fill()関数の使い方の詳しい説明 PHPのarray_fill()関数の使い方の詳しい説明 Jun 27, 2023 am 08:42 AM

PHP プログラミングにおいて、配列は大量のデータを簡単に処理できる非常に重要なデータ構造です。 PHP は配列関連の関数を多数提供しており、array_fill() はその 1 つです。この記事では、array_fill() 関数の使い方と実際の応用におけるヒントを詳しく紹介します。 1. array_fill() 関数の概要 array_fill() 関数の機能は、同じ値で構成される指定された長さの配列を作成することです。具体的には、この関数の構文は次のとおりです。

この点を理解してフロントエンド担当者の7割をキャッチアップした記事 この点を理解してフロントエンド担当者の7割をキャッチアップした記事 Sep 06, 2022 pm 05:03 PM

同僚は、これによって指摘されたバグのために立ち往生しました。Vue2 のこの指摘の問題により、アロー関数が使用され、その結果、対応する props を取得できなくなりました。私がそれを彼に紹介したとき、彼はそれを知りませんでした。その後、私はわざとフロントエンド コミュニケーション グループに目を向けました。これまでのところ、フロントエンド プログラマーの少なくとも 70% はまだそれを理解していません。今日私はそれを共有しますyou this link. もしすべてが間違っている場合 まだ学習していない場合は、大きな口を与えてください。

Vue2 がこれを通じてさまざまなオプションのプロパティにアクセスできる理由について話しましょう Vue2 がこれを通じてさまざまなオプションのプロパティにアクセスできる理由について話しましょう Dec 08, 2022 pm 08:22 PM

この記事は、vue ソース コードを解釈するのに役立ち、これを使用して Vue2 のさまざまなオプションのプロパティにアクセスできる理由を紹介します。

Python で Array モジュールを使用する方法 Python で Array モジュールを使用する方法 May 01, 2023 am 09:13 AM

Python の配列モジュールは事前定義された配列であるため、標準のリストよりもメモリ内で使用するスペースがはるかに少なく、追加、削除、インデックス付け、スライスなどの要素レベルの操作を高速に実行することもできます。さらに、配列内のすべての要素は同じ型であるため、平均値、最大値、最小値の計算など、配列が提供する効率的な数値演算関数を使用できます。さらに、配列モジュールは、配列オブジェクトのバイナリ ファイルへの直接の書き込みと読み取りもサポートしているため、大量の数値データを処理する際の効率が向上します。したがって、大量の同種データを処理する必要がある場合は、Python の配列モジュールを使用してコードの実行効率を最適化することを検討してください。配列モジュールを使用するには、まず次のことを行う必要があります。

Java での ArrayStoreException の一般的な原因は何ですか? Java での ArrayStoreException の一般的な原因は何ですか? Jun 25, 2023 am 09:48 AM

Java プログラミングでは、配列は重要なデータ構造です。配列は 1 つの変数に複数の値を格納できます。さらに重要なのは、インデックスを使用して各値にアクセスできることです。ただし、配列を操作しているときに、いくつかの例外が発生する場合があります。そのうちの 1 つは ArrayStoreException です。この記事では、ArrayStoreException 例外の一般的な原因について説明します。 1. 型の不一致 配列の作成時に要素の型を指定する必要があります。互換性のないデータ型を配列に格納しようとすると、

See all articles