首頁 > 後端開發 > Python教學 > 利用Python抓取行政區劃碼的方法

利用Python抓取行政區劃碼的方法

WBOY
發布: 2016-12-05 13:27:19
原創
1874 人瀏覽過

前言

國家統計局網站上有相對比較齊的行政區劃碼,對於一些網站來說這是非常基礎的數據,所以寫了個Python程式將這部分數據抓取下來。

注意:抓取下來以後還要進行簡單的人工的整理

範例程式碼:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*&#63;"><span lang="EN-US" style=".*&#63;">(\d+)<span>.*&#63;</span></span><span style=".*&#63;">(.*&#63;)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()
登入後複製

注意事項:

另外,關於國家地區表的信息,還有另外一種獲取渠道,那就是QQ軟體自帶的國家地區資訊表。 (檔案名稱為LocList.xml),一般的儲存位置為:C:Program FilesTencentQQI18N2052

如需中文版安裝中文版QQ即可獲取,如需英文版則安裝英文版QQ。國際版在1033目錄。

code都是依照ISO3166標準寫的,極易導入資料庫。

總結

以上就是利用Python取得行政區劃碼的全部內容,希望本文的內容對大家學習或使用python能有所幫助,如果有疑問大家可以留言交流。

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板