python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
python mysqldb连接数据库
Mar 16 Python
Python使用面向对象方式创建线程实现12306售票系统
Dec 24 Python
Python探索之创建二叉树
Oct 25 Python
Python实现抢购IPhone手机
Feb 07 Python
Python3利用Dlib19.7实现摄像头人脸识别的方法
May 11 Python
python django框架中使用FastDFS分布式文件系统的安装方法
Jun 10 Python
python用for循环求和的方法总结
Jul 08 Python
python GUI库图形界面开发之PyQt5树形结构控件QTreeWidget详细使用方法与实例
Mar 02 Python
python3中数组逆序输出方法
Dec 01 Python
PyQt5通过信号实现MVC的示例
Feb 06 Python
python解析json数据
Apr 29 Python
Pytorch中expand()的使用(扩展某个维度)
Jul 15 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
php中url函数介绍及使用示例
2014/02/13 PHP
php函数传值的引用传递注意事项分析
2016/06/25 PHP
PHP单例模式与工厂模式详解
2017/08/29 PHP
分享5个非常有用的Laravel Blade指令
2018/05/30 PHP
Laravel 5.5 异常处理 & 错误日志的解决
2019/10/17 PHP
js版本A*寻路算法
2006/12/22 Javascript
jquery checkbox全选、取消全选实现代码
2010/03/05 Javascript
使用js 设置url参数
2013/07/08 Javascript
使用js Math.random()函数生成n到m间的随机数字
2014/10/09 Javascript
JavaScript实现的浮动层框架用法实例分析
2015/10/10 Javascript
Bootstrap学习笔记之css样式设计(2)
2016/06/07 Javascript
详解angularJs中自定义directive的数据交互
2017/01/13 Javascript
JavaScript Canvas实现验证码
2020/08/02 Javascript
python通过floor函数舍弃小数位的方法
2015/03/17 Python
深入理解Python3 内置函数大全
2017/11/23 Python
Python PyQt4实现QQ抽屉效果
2018/04/20 Python
Python实现登陆文件验证方法
2018/10/06 Python
python浪漫表白源码
2019/04/05 Python
Python数据持久化存储实现方法分析
2019/12/21 Python
解决Tensorboard 不显示计算图graph的问题
2020/02/15 Python
Python绘制动态水球图过程详解
2020/06/03 Python
Python列表元素删除和remove()方法详解
2021/01/04 Python
美国餐厅用品和厨房设备批发网站:KaTom Restaurant Supply
2018/01/27 全球购物
如何开发安全的AJAX应用
2014/03/26 面试题
精彩的推荐信范文
2013/11/26 职场文书
汽车队司机先进事迹材料
2014/02/01 职场文书
维修工先进事迹
2014/05/29 职场文书
迎国庆演讲稿
2014/09/05 职场文书
党员个人对照检查材料范文
2014/09/24 职场文书
市委召开党的群众路线教育实践活动总结大会报告
2014/10/21 职场文书
2015年科协工作总结
2015/05/19 职场文书
2015年小学教导处工作总结
2015/05/26 职场文书
离婚民事起诉状
2015/08/03 职场文书
2016年乡镇七一建党节活动总结
2016/04/05 职场文书
nginx对http请求处理的各个阶段详析
2021/03/31 Servers
Spring中bean集合注入的方法详解
2022/07/07 Java/Android