python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
python对url格式解析的方法
May 13 Python
十个Python程序员易犯的错误
Dec 15 Python
老生常谈Python之装饰器、迭代器和生成器
Jul 26 Python
对python实现模板生成脚本的方法详解
Jan 30 Python
python儿童学游戏编程知识点总结
Jun 03 Python
PowerBI和Python关于数据分析的对比
Jul 11 Python
Python循环中else,break和continue的用法实例详解
Jul 11 Python
Python 实现文件读写、坐标寻址、查找替换功能
Sep 11 Python
python生成requirements.txt的两种方法
Sep 18 Python
Python拼接字符串的7种方式详解
Mar 19 Python
python利用pandas分析学生期末成绩实例代码
Jul 09 Python
Python学习之异常中的finally使用详解
Mar 16 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
PHP设置图片文件上传大小的具体实现方法
2013/10/11 PHP
php的memcache类分享(memcache队列)
2014/03/26 PHP
PHP数据库操作四:mongodb用法分析
2017/08/16 PHP
分享8个Laravel模型时间戳使用技巧小结
2020/02/12 PHP
php中加密解密DES类的简单使用方法示例
2020/03/26 PHP
学习ExtJS(二) Button常用方法
2009/10/07 Javascript
JS 中document.URL 和 windows.location.href 的区别
2009/11/11 Javascript
JQuery slideshow的一个小问题(如何发现及解决过程)
2013/02/06 Javascript
提交表单时执行func方法实现代码
2013/03/17 Javascript
JQuery的$和其它JS发生冲突的快速解决方法
2014/01/24 Javascript
jQuery中slideUp()方法用法分析
2014/12/24 Javascript
浅谈Javascript线程及定时机制
2015/07/02 Javascript
js实现汉字排序的方法
2015/07/23 Javascript
JavaScript的面向对象编程基础
2015/08/13 Javascript
DOM操作和jQuery实现选项移动操作的简单实例
2016/06/07 Javascript
JS简单生成随机数(随机密码)的方法
2017/05/11 Javascript
详解Vue学习笔记入门篇之组件的内容分发(slot)
2017/07/17 Javascript
react-native DatePicker日期选择组件的实现代码
2017/09/12 Javascript
jQuery实现动态显示select下拉列表数据的方法
2018/02/05 jQuery
Node.js中的不安全跳转如何防御详解
2018/10/21 Javascript
python中zip和unzip数据的方法
2015/05/27 Python
Python3.5面向对象编程图文与实例详解
2019/04/24 Python
pandas分区间,算频率的实例
2019/07/04 Python
Python使用正则表达式分割字符串的实现方法
2019/07/16 Python
Django Rest framework频率原理与限制
2019/07/26 Python
python中使用input()函数获取用户输入值方式
2020/05/03 Python
如何利用python发送邮件
2020/09/26 Python
Python获取指定网段正在使用的IP
2020/12/14 Python
纯CSS3实现滚动的齿轮动画效果
2014/06/05 HTML / CSS
在线学习西班牙语、法语或其他语言:Babbel.com
2018/02/07 全球购物
职业技术学校毕业生推荐信
2013/12/03 职场文书
大学生写自荐信的技巧
2014/01/08 职场文书
人力资源部门的主要职能
2014/02/22 职场文书
超越自我演讲稿
2014/05/21 职场文书
年度评优评先方案
2014/06/03 职场文书
海底两万里读书笔记
2015/06/26 职场文书