编程 Python

python网络爬虫采集联想词示例

Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示，下面这个list中的代理ip可能失效，请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)

python网络爬虫采集联想词示例

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python对url格式解析的方法

May 13 Python

十个Python程序员易犯的错误

Dec 15 Python

老生常谈Python之装饰器、迭代器和生成器

Jul 26 Python

对python实现模板生成脚本的方法详解

Jan 30 Python

python儿童学游戏编程知识点总结

Jun 03 Python

PowerBI和Python关于数据分析的对比

Jul 11 Python

Python循环中else,break和continue的用法实例详解

Jul 11 Python

Python 实现文件读写、坐标寻址、查找替换功能

Sep 11 Python

python生成requirements.txt的两种方法

Sep 18 Python

Python拼接字符串的7种方式详解

Mar 19 Python

python利用pandas分析学生期末成绩实例代码

Jul 09 Python

Python学习之异常中的finally使用详解

Mar 16 Python

python基础教程之实现石头剪刀布游戏示例

Feb 11 #Python

python使用递归解决全排列数字示例

Feb 11 #Python

python基础教程之popen函数操作其它程序的输入和输出示例

Feb 10 #Python

python基础教程之python消息摘要算法使用示例

Feb 10 #Python

go和python调用其它程序并得到程序输出

Feb 10 #Python

python实现socket端口重定向示例

Feb 10 #Python

python访问sqlserver示例

Feb 10 #Python

You might like

PHP设置图片文件上传大小的具体实现方法

2013/10/11 PHP

php的memcache类分享(memcache队列)

2014/03/26 PHP

PHP数据库操作四：mongodb用法分析

2017/08/16 PHP

分享8个Laravel模型时间戳使用技巧小结

2020/02/12 PHP

php中加密解密DES类的简单使用方法示例

2020/03/26 PHP

学习ExtJS（二） Button常用方法

2009/10/07 Javascript

JS 中document.URL 和 windows.location.href 的区别

2009/11/11 Javascript

JQuery slideshow的一个小问题(如何发现及解决过程)

2013/02/06 Javascript

提交表单时执行func方法实现代码

2013/03/17 Javascript

JQuery的$和其它JS发生冲突的快速解决方法

2014/01/24 Javascript

jQuery中slideUp()方法用法分析

2014/12/24 Javascript

浅谈Javascript线程及定时机制

2015/07/02 Javascript

js实现汉字排序的方法

2015/07/23 Javascript

JavaScript的面向对象编程基础

2015/08/13 Javascript

DOM操作和jQuery实现选项移动操作的简单实例

2016/06/07 Javascript

JS简单生成随机数(随机密码)的方法

2017/05/11 Javascript

详解Vue学习笔记入门篇之组件的内容分发(slot)

2017/07/17 Javascript

react-native DatePicker日期选择组件的实现代码

2017/09/12 Javascript

jQuery实现动态显示select下拉列表数据的方法

2018/02/05 jQuery

Node.js中的不安全跳转如何防御详解

2018/10/21 Javascript

python中zip和unzip数据的方法

2015/05/27 Python

Python3.5面向对象编程图文与实例详解

2019/04/24 Python

pandas分区间,算频率的实例

2019/07/04 Python

Python使用正则表达式分割字符串的实现方法

2019/07/16 Python

Django Rest framework频率原理与限制

2019/07/26 Python

python中使用input()函数获取用户输入值方式

2020/05/03 Python

如何利用python发送邮件

2020/09/26 Python

Python获取指定网段正在使用的IP

2020/12/14 Python

纯CSS3实现滚动的齿轮动画效果

2014/06/05 HTML / CSS

在线学习西班牙语、法语或其他语言：Babbel.com

2018/02/07 全球购物

职业技术学校毕业生推荐信

2013/12/03 职场文书

大学生写自荐信的技巧

2014/01/08 职场文书

人力资源部门的主要职能

2014/02/22 职场文书

超越自我演讲稿

2014/05/21 职场文书

年度评优评先方案

2014/06/03 职场文书

海底两万里读书笔记

2015/06/26 职场文书