python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
Python实现栈的方法
May 26 Python
Python有序查找算法之二分法实例分析
Dec 11 Python
python+opencv实现动态物体追踪
Jan 09 Python
python取代netcat过程分析
Feb 10 Python
Python3.6简单反射操作示例
Jun 14 Python
Pycharm设置去除显示的波浪线方法
Oct 28 Python
在Python中调用Ping命令,批量IP的方法
Jan 26 Python
twilio python自动拨打电话,播放自定义mp3音频的方法
Aug 08 Python
Python:slice与indices的用法
Nov 25 Python
Python猴子补丁知识点总结
Jan 05 Python
Python flask框架端口失效解决方案
Jun 04 Python
Python实现打包成库供别的模块调用
Jul 13 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
php读取javascript设置的cookies的代码
2010/04/12 PHP
允许phpmyadmin空密码登录的配置方法
2011/05/29 PHP
Yii2简单实现多语言配置的方法
2016/07/23 PHP
PHP如何获取当前主机、域名、网址、路径、端口等参数
2017/06/09 PHP
PHP安装BCMath扩展的方法
2019/02/13 PHP
硬盘浏览程序,保存成网页格式便可使用
2006/12/03 Javascript
9个javascript语法高亮插件 推荐
2009/07/18 Javascript
让mayfish支持mysqli数据库驱动的实现方法
2010/05/22 Javascript
jquery 新浪网易的评论块制作
2010/07/01 Javascript
JQuery循环滚动图片代码
2011/12/08 Javascript
html+css+js实现xp window界面及有关功能
2013/03/26 Javascript
JavaScript跨浏览器获取页面中相同class节点的方法
2015/03/03 Javascript
JQuery节点元素属性操作方法
2015/06/11 Javascript
AngularJS教程 ng-style 指令简单示例
2016/08/03 Javascript
Vue.js如何实现路由懒加载浅析
2017/08/14 Javascript
动态Axios的配置步骤详解
2018/01/12 Javascript
React Native中NavigatorIOS组件的简单使用详解
2018/01/27 Javascript
[01:40]2014DOTA2国际邀请赛 三冰SOLO赛后采访恶搞
2014/07/09 DOTA
[02:19]DOTA选手解说齐贺岁
2018/02/11 DOTA
Python2.X/Python3.X中urllib库区别讲解
2017/12/19 Python
python ipset管理 增删白名单的方法
2019/01/14 Python
Django Serializer HiddenField隐藏字段实例
2020/03/31 Python
Python基于进程池实现多进程过程解析
2020/04/30 Python
Pytorch学习之torch用法----比较操作(Comparison Ops)
2020/06/28 Python
python利用蒙版抠图(使用PIL.Image和cv2)输出透明背景图
2020/08/04 Python
CSS3实现任意图片lowpoly动画效果实例
2017/05/11 HTML / CSS
Fossil美国官网:化石手表、手袋、首饰及配饰
2019/02/17 全球购物
黄河象教学反思
2014/02/10 职场文书
新郎结婚保证书
2015/02/26 职场文书
因公司原因离职的辞职信范文
2015/05/12 职场文书
2015年网络舆情工作总结
2015/07/24 职场文书
MySQL 外键约束和表关系相关总结
2021/06/20 MySQL
python 安全地删除列表元素的方法
2022/03/16 Python
苹果的回收机器人可以通过拆解iPhone获取大量的金和铜并外公布了环境保护最新进展
2022/04/21 数码科技
JavaScript实现九宫格拖拽效果
2022/06/28 Javascript
Navicat Premium自定义 sql 标签的创建方式
2022/09/23 数据库