python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
python生成器的使用方法
Nov 21 Python
使用cx_freeze把python打包exe示例
Jan 24 Python
python发布模块的步骤分享
Feb 21 Python
wxPython窗口的继承机制实例分析
Sep 28 Python
跟老齐学Python之类的细节
Oct 13 Python
介绍Python中的文档测试模块
Apr 28 Python
Python实现获取前100组勾股数的方法示例
May 04 Python
python交互界面的退出方法
Feb 16 Python
pymongo中聚合查询的使用方法
Mar 22 Python
pyecharts动态轨迹图的实现示例
Apr 17 Python
Python学习之os模块及用法
Jun 03 Python
最新版 Windows10上安装Python 3.8.5的步骤详解
Nov 28 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
php Smarty 字符比较代码
2011/02/27 PHP
php学习之function的用法
2012/07/14 PHP
LAMP环境使用Composer安装Laravel的方法
2017/03/25 PHP
jQuery数据缓存功能的实现思路及简单模拟
2013/05/27 Javascript
jQuery实现点击小图显示大图代码分享
2015/08/25 Javascript
javascript 广告移动特效的实现代码
2016/06/25 Javascript
微信小程序 wxapp画布 canvas详细介绍
2016/10/31 Javascript
JS常用知识点整理
2017/01/21 Javascript
js中json对象和字符串的理解及相互转化操作实现方法
2017/09/22 Javascript
详解使用PM2管理nodejs进程
2017/10/24 NodeJs
vue项目中使用ueditor的实例讲解
2018/03/05 Javascript
分享一款超好用的JavaScript 打包压缩工具
2020/04/26 Javascript
Vue3配置axios跨域实现过程解析
2020/11/25 Vue.js
[41:11]完美世界DOTA2联赛PWL S2 Inki vs Magma 第一场 11.22
2020/11/24 DOTA
Python计算三维矢量幅度的方法
2015/06/15 Python
python itchat实现微信好友头像拼接图的示例代码
2017/08/14 Python
python实现两个经纬度点之间的距离和方位角的方法
2019/07/05 Python
django云端留言板实例详解
2019/07/22 Python
Django--权限Permissions的例子
2019/08/28 Python
Django Form and ModelForm的区别与使用
2019/12/06 Python
python ImageDraw类实现几何图形的绘制与文字的绘制
2020/02/26 Python
Python3监控windows,linux系统的CPU、硬盘、内存使用率和各个端口的开启情况详细代码实例
2020/03/18 Python
Python如何用wx模块创建文本编辑器
2020/06/07 Python
纯CSS3实现滚动的齿轮动画效果
2014/06/05 HTML / CSS
CSS3中的Transition过度与Animation动画属性使用要点
2016/05/20 HTML / CSS
UNIONBAY官网:美国青少年服装品牌
2019/03/26 全球购物
英国婚礼商城:Wedding Mall
2019/11/02 全球购物
英国家具、照明、家居用品网上商店:Wayfair.co.uk
2020/02/13 全球购物
几道PHP面试题
2013/04/14 面试题
机械制造专业个人的自我评价
2013/12/28 职场文书
物流管理专业毕业生求职信
2014/03/23 职场文书
教师节活动主持词
2014/04/02 职场文书
相亲大会策划方案
2014/06/05 职场文书
淘宝好评语句大全
2014/12/31 职场文书
幼儿园教研工作总结2015
2015/05/12 职场文书
小区物业管理2015年度工作总结
2015/10/22 职场文书