ホームページ > バックエンド開発 > Python チュートリアル > Python がユーザー名スクリプト コードを取得します。

Python がユーザー名スクリプト コードを取得します。

WBOY
リリース: 2016-06-16 08:45:51
オリジナル
1454 人が閲覧しました

私は最近 Python を学習したので、Python を使用して Discuz のユーザー名をキャプチャするスクリプトを作成しました。コードは小さいですが、非常に簡単です。アイデアは非常に単純です。つまり、タイトルを定期的に照合し、ユーザー名を抽出してテキスト ドキュメントに書き込むということです。このプログラムは、Baidu ウェブマスター コミュニティを例に挙げています (合計 400,000 人を超えるユーザーがいます)。遅延が使用されたにもかかわらず、50,000 人を超えるユーザー名しかキャプチャされなかったことが後で判明しました。合計するとブロックされました。 。 。
コードは次のとおりです:

コードをコピーしますコードは次のとおりです:

# -*- コーディング: utf-8 -*-
# 著者: Tianyi
# ブログ: http://www.90blog.org
# バージョン: 1.0
# 機能: Python は Baidu ウェブマスター プラットフォームのユーザー名スクリプトをキャプチャします

import urllib
import urllib2
import re
インポート時間

def BiduSpider():
pattern = re.compile(r'(.*) ) 個人情報 Baidu ウェブマスター コミュニティ')
uid=1
thedatas = []
while uid theUrl = "http://bbs.zhanzhang.baidu . com/home.php?mod=space&uid="+str(uid)
uid +=1
theResponse = urllib2.urlopen(theUrl)
thePage = theResponse.read()
#通常の一致user name
theFindall = re.findall(pattern,thePage)
#頻繁なアクセスが禁止されないように 0.5 秒待ちます
time.sleep(0.5)
if theFindall :
#中文Encoding出力の文字化けを防ぐため
thedatas = theFindall[0].decode('utf-8').encode('gbk')
#テキスト テキスト ドキュメントを書きます
f = open('theUid.txt' ,'a')
f.writelines(thedatas+'n')
f.close()

if __name__ == '__main__':
BiduSpider()

最終結果は次のとおりです:

Python がユーザー名スクリプト コードを取得します。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート