PythonはURL短縮接続を実装するために2つのメソッドを使用します

高洛峰
リリース: 2016-10-18 14:03:41
オリジナル
1327 人が閲覧しました

ほぼすべての WeChat ウェブサイトは URL 短縮サービスを提供しており、その原理は、特定のアルゴリズムに従って URL アドレスから文字列を生成し、それを短いドメイン名に追加して新しい URL アドレスを形成することです。短縮アドレスと元のアドレス ユーザーがこの新しい短縮アドレスをクリックすると、短縮アドレス サービスは短縮ドメイン名の後のいくつかの文字列に基づいて元のアドレスをデータベースから読み取り、そのページにジャンプします。

たとえば、Sina Weibo の URL は http://t.cn/xxxxxxx です。t.cn はドメイン名で、その後に 7 桁の文字列が続きます。

方法1:ハッシュライブラリを使ってアルゴリズムをカスタマイズする

あまり長いURLを本文中に表示すると煩雑になるため、表示を省略する方法や、短いURLの方法を使います

でクリックの統計を容易にし、コンテンツのフィルタリングを実行するため、ハッシュ値がクラックされるのを防ぐために、

で独自のソルトを追加できます。この方法では、コードマップは元の URL をクラックできません。

結果をよりランダムにするために、各サイクルで使用されない 2 番目のビットを e に保存します。これにより、結果の競合率が小さくなります。

#引入哈希库
import hashlib 
       
def get_md5(s): 
    s = s.encode('utf8') if isinstance(s, unicode) else s 
    m = hashlib.md5() 
    m.update(s) 
    return m.hexdigest() 
       
code_map = ( 
           'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'g' , 'h' , 
           'i' , 'j' , 'k' , 'l' , 'm' , 'n' , 'o' , 'p' , 
           'q' , 'r' , 's' , 't' , 'u' , 'v' , 'w' , 'x' , 
           'y' , 'z' , '0' , '1' , '2' , '3' , '4' , '5' , 
           '6' , '7' , '8' , '9' , 'A' , 'B' , 'C' , 'D' , 
           'E' , 'F' , 'G' , 'H' , 'I' , 'J' , 'K' , 'L' , 
           'M' , 'N' , 'O' , 'P' , 'Q' , 'R' , 'S' , 'T' , 
           'U' , 'V' , 'W' , 'X' , 'Y' , 'Z'
            ) 
       
       
def get_hash_key(long_url): 
    hkeys = [] 
    hex = get_md5(long_url) 
    for i in xrange(0, 4): 
        n = int(hex[i*8:(i+1)*8], 16) 
        v = [] 
        e = 0
        for j in xrange(0, 5): 
            x = 0x0000003D & n 
            e |= ((0x00000002 & n ) >> 1) << j 
            v.insert(0, code_map[x]) 
            n = n >> 6
        e |= n << 5
        v.insert(0, code_map[e & 0x0000003D]) 
        hkeys.append(&#39;&#39;.join(v)) 
    return hkeys 
       
if __name__ == &#39;__main__&#39;: 
    print get_hash_key(&#39;http://www.pythontab.com&#39;)
ログイン後にコピー

メソッド2: libsurl ライブラリを使用します

libsurl はい 短縮 URL を生成するための C および Python ライブラリで、bit.ly や tinyurl などの短縮 URL サービス Web サイトをサポートします。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート