-
- /**
- * 短连接生成算法
- * site: bbs.it-home.org
- */
- class Short_Url {
- #字符表
- public static $charset = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
-
- public static function short($url) {
- $key = "alexis";
- $urlhash = md5($key . $url);
- $len = strlen($urlhash);
-
- #将加密后的串分成4段,每段4字节,对每段进行计算,一共可以生成四组短连接
- for ($i = 0; $i < 4; $i++) {
- $urlhash_piece = substr($urlhash, $i * $len / 4, $len / 4);
- #将分段的位与0x3fffffff做位与,0x3fffffff表示二进制数的30个1,即30位以后的加密串都归零
- $hex = hexdec($urlhash_piece) & 0x3fffffff; #此处需要用到hexdec()将16进制字符串转为10进制数值型,否则运算会不正常
-
- $short_url = "http://t.cn/";
- #生成6位短连接
- for ($j = 0; $j < 6; $j++) {
- #将得到的值与0x0000003d,3d为61,即charset的坐标最大值
- $short_url .= self::$charset[$hex & 0x0000003d];
- #循环完以后将hex右移5位
- $hex = $hex >> 5;
- }
-
- $short_url_list[] = $short_url;
- }
-
- return $short_url_list;
- }
- }
-
- $url = "http://www.bbs.it-home.org/jb//";
- $short = Short_Url::short($url);
- print_r($short);
- ?>
复制代码
输出结果:
Array ( [0] => http://t.cn/KyfLyH [1] => http://t.cn/bPafHS [2] => http://t.cn/H880aD [3] => http://t.cn/TmvDK0 )
生成的短url存到服务器里,做一个映射,short_url => original_url,输入短url的时候按照映射转回长url,然后访问原始url即可。
代码:
-
-
- Class TinyURL {
- static private $key = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"; //可以多位 保证每位的字符在URL里面正常显示即可
- private function __construct() {}
- private function __clone(){}
-
- static public function encode($value) {
- $base = strlen( self::$key );
- $arr = array();
- while( $value != 0 ) {
- $arr[] = $value % $base;
- $value = floor( $value / $base );
- }
- $result = "";
- while( isset($arr[0]) ) $result .= substr(self::$key, array_pop($arr), 1 );
- return $result;
- }
-
- static public function decode($value) {
- $base = strlen( self::$key );
- $num = 0;
- $key = array_flip( str_split(self::$key) );
- $arr = str_split($value);
- for($len = count($arr) - 1, $i = 0; $i <= $len; $i++) {
- $num += pow($base, $i) * $key[$arr[$len-$i]];
- }
- return $num;
- }
- }
复制代码
调用示例:
-
-
- $t = 100;
- $time_start = microtime(true);
- while($t--){
- var_dump( TinyURL::encode(1000000) );
- var_dump( TinyURL::decode("4C92") );
- }
- $time_end = microtime(true);
- printf("[内存使用: %.2fMB]\r\n", memory_get_usage() /1024 /1024 );
- printf("[内存最高使用: %.2fMB]\r\n", memory_get_peak_usage() /1024 /1024) ;
- printf("[执行时间: %.2f毫秒]\r\n", ($time_end - $time_start) * 1000 );
复制代码
以上程式碼適用於:
自增ID的傳統關係型資料庫。
需要執行二次SQL,第一次取得自增ID,第二次根據ID產生短連結。 [或3次,額外一次用於判斷是否存在此短連結。 ]
此外,還有一種是根據URL進行Hash運算的演算法,這種演算法的優點:
1,無需id,用Key/Value這樣的格式即可滿足儲存。
2,SQL插入只需一條語句。
3,產生的資料具有離散性,無法觀察生成規律。
缺點:
1,所以的Hash演算法都存在衝突的可能,一旦衝突原始的就會被覆蓋。 [當然你可以增加額外的邏輯去判斷。 ]
2,資料規模不好控制,你不知道什麼時候才能開始使用新的Hash資料位,但隨著資料量的增加,衝突的機率會越來越高。
此種的程式碼適用於NoSQL等非關係型資料庫,查找快更新快。
|