Python がユーザー名スクリプトコードを取得します。-Python チュートリアル-php.cn

Python がユーザー名スクリプトコードを取得します。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2016-06-16 08:45:51

オリジナル

1657 人が閲覧しました

私は最近 Python を学習したので、Python を使用して Discuz のユーザー名をキャプチャするスクリプトを作成しました。コードは小さいですが、非常に簡単です。アイデアは非常に単純です。つまり、タイトルを定期的に照合し、ユーザー名を抽出してテキストドキュメントに書き込むということです。このプログラムは、Baidu ウェブマスターコミュニティを例に挙げています (合計 400,000 人を超えるユーザーがいます)。遅延が使用されたにもかかわらず、50,000 人を超えるユーザー名しかキャプチャされなかったことが後で判明しました。合計するとブロックされました。。。
コードは次のとおりです:

コードをコピーしますコードは次のとおりです:

# -*- コーディング: utf-8 -*-
# 著者: Tianyi
# ブログ: http://www.90blog.org
# バージョン: 1.0
# 機能: Python は Baidu ウェブマスタープラットフォームのユーザー名スクリプトをキャプチャします

import urllib
import urllib2
import re
インポート時間

def BiduSpider():
pattern = re.compile(r'(.*) ) 個人情報 Baidu ウェブマスターコミュニティ')
uid=1
thedatas = []
while uid theUrl = "http://bbs.zhanzhang.baidu . com/home.php?mod=space&uid="+str(uid)
uid +=1
theResponse = urllib2.urlopen(theUrl)
thePage = theResponse.read()
#通常の一致user name
theFindall = re.findall(pattern,thePage)
#頻繁なアクセスが禁止されないように 0.5 秒待ちます
time.sleep(0.5)
if theFindall :
#中文Encoding出力の文字化けを防ぐため
thedatas = theFindall[0].decode('utf-8').encode('gbk')
#テキストテキストドキュメントを書きます
f = open('theUid.txt' ,'a')
f.writelines(thedatas+'n')
f.close()

if __name__ == '__main__':
BiduSpider()

最終結果は次のとおりです:

Python がユーザー名スクリプトコードを取得します。