社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > python网络爬虫采集联想词示例

python网络爬虫采集联想词示例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-16 08:45:21

原创

1606 人浏览过

python爬虫_采集联想词代码

复制代码代码如下:

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示，下面这个list中的代理ip可能失效，请换上有效的代理ip
iplist = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']

list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }

proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})

    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)

    for key in headers:
        req.add_header(key,headers[key])

    html = urllib2.urlopen(req).read()

    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)

相关标签：

python网络爬虫联想词

上一篇：python基础教程之获取本机ip数据包示例下一篇：zbar解码二维码和条形码示例

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

网页爬虫 - Python爬虫入门知识

来自于 1970-01-01 08:00:00

0

0

0

网页爬虫 - python requests爬虫问题

来自于 1970-01-01 08:00:00

0

0

0

网页爬虫 - Python requests.get 爬虫设置代理 IP地址未改变

来自于 1970-01-01 08:00:00

0

0

0

网页爬虫 - python3.4.1 request模块报错 'list' object has no attribute 'get'

来自于 1970-01-01 08:00:00

0

0

0

html - 爬虫时出现“DNS lookup failed”，打开网页却没问题，这是什么情况？

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1437894
php入门教程之一周学会PHP

4298450
JAVA 初级入门视频教程

2669979
小甲鱼零基础入门学习Python视频教程

517078
PHP 零基础入门教程

878093

最新下载

更多>

网站特效

网站源码

网站素材

前端模板