python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
使用python提取html文件中的特定数据的实现代码
Mar 24 Python
用python 制作图片转pdf工具
Jan 30 Python
Python闭包的两个注意事项(推荐)
Mar 20 Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 Python
从CentOS安装完成到生成词云python的实例
Dec 01 Python
python并发编程之线程实例解析
Dec 27 Python
Python使用matplotlib绘图无法显示中文问题的解决方法
Mar 14 Python
Python线程下使用锁的技巧分享
Sep 13 Python
对python实现合并两个排序链表的方法详解
Jan 23 Python
详解django+django-celery+celery的整合实战
Mar 19 Python
Django中的静态文件管理过程解析
Aug 01 Python
python pygame实现球球大作战
Nov 25 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
发一个php简单的伪原创程序,配合商城采集用的
2010/10/12 PHP
学习php设计模式 php实现装饰器模式(decorator)
2015/12/07 PHP
PHP判断手机是IOS还是Android
2015/12/09 PHP
PHP内核探索之变量
2015/12/22 PHP
PHP的swoole扩展安装方法详细教程
2016/05/18 PHP
php5.5使用PHPMailer-5.2发送邮件的完整步骤
2018/10/14 PHP
Laravel timestamps 设置为unix时间戳的方法
2019/10/11 PHP
关于IFRAME 自适应高度的研究
2006/07/20 Javascript
javascript 中对象的继承〔转贴〕
2007/01/22 Javascript
JS input 数字验证代码
2009/07/30 Javascript
jquery 打开窗口返回值实现代码
2010/03/04 Javascript
颜色选择器 Color Picker,IE,Firefox,Opera,Safar
2010/11/25 Javascript
用正则表达式替换图片地址img标签
2013/11/22 Javascript
Jquery uploadify图片上传插件无法上传的解决方法
2013/12/16 Javascript
jquery修改属性值实例代码(设置属性值)
2014/01/06 Javascript
jQuery元素的隐藏与显示实例
2015/01/20 Javascript
javascript实现的简单的表单验证
2015/07/10 Javascript
jQuery添加删除DOM元素方法详解
2016/01/18 Javascript
Vue Router的懒加载路径的解决方法
2018/06/21 Javascript
vue动画打包后失效问题的解决方法
2018/09/18 Javascript
微信小程序tab切换可滑动切换导航栏跟随滚动实现代码
2019/09/04 Javascript
JS实现判断移动端PC端功能
2020/02/21 Javascript
[01:31:02]TNC vs VG 2019国际邀请赛淘汰赛 胜者组赛BO3 第一场
2019/08/22 DOTA
Python解析最简单的验证码
2016/01/07 Python
Python闭包之返回函数的函数用法示例
2018/01/27 Python
Django保护敏感信息的方法示例
2019/05/09 Python
Python模块future用法原理详解
2020/01/20 Python
python与idea的集成的实现
2020/11/20 Python
法国时尚童装网站:Melijoe
2016/08/10 全球购物
美国顶级品牌男士大码服装店:DXL
2017/08/30 全球购物
美国领先的在线旅游网站:Orbitz
2018/11/05 全球购物
英国No.1体育用品零售商:SportsDirect.com
2019/10/16 全球购物
募捐倡议书怎么写
2014/05/14 职场文书
傲慢与偏见读书笔记
2015/06/29 职场文书
竞聘书的秘诀
2019/04/02 职场文书
微信小程序用户授权最佳实践指南
2021/05/08 Javascript