python爬虫教程之爬取百度贴吧并下载的示例


Posted in Python onMarch 07, 2014

测试url:http://tieba.baidu.com/p/27141123322?pn=
begin  1
end   4

import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url:  \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
Python 相关文章推荐
简单介绍Python中的JSON使用
Apr 28 Python
Python实现队列的方法
May 26 Python
Python使用回溯法子集树模板解决爬楼梯问题示例
Sep 08 Python
Windows下Anaconda的安装和简单使用方法
Jan 04 Python
python中数据爬虫requests库使用方法详解
Feb 11 Python
分析运行中的 Python 进程详细解析
Jun 22 Python
Python 读取串口数据,动态绘图的示例
Jul 02 Python
Python sqlalchemy时间戳及密码管理实现代码详解
Aug 01 Python
Python中pass的作用与使用教程
Nov 13 Python
python opencv实现图像配准与比较
Feb 09 Python
python缺失值的解决方法总结
Jun 09 Python
python的html标准库
Apr 29 Python
python处理json数据中的中文
Mar 06 #Python
Python中针对函数处理的特殊方法
Mar 06 #Python
python连接mysql调用存储过程示例
Mar 05 #Python
python益智游戏计算汉诺塔问题示例
Mar 05 #Python
python连接mysql并提交mysql事务示例
Mar 05 #Python
python遍历文件夹并删除特定格式文件的示例
Mar 05 #Python
python的三目运算符和not in运算符使用示例
Mar 03 #Python
You might like
php实现比较全的数据库操作类
2015/06/18 PHP
CodeIgniter连贯操作的底层原理分析
2016/05/17 PHP
php版微信小店API二次开发及使用示例
2016/11/12 PHP
PHP商品秒杀问题解决方案实例详解【mysql与redis】
2019/07/22 PHP
php 实现银联商务H5支付的示例代码
2019/10/12 PHP
javascript flash下fromCharCode和charCodeAt方法使用说明
2008/01/12 Javascript
JavaScript CSS菜单功能 改进版
2008/12/20 Javascript
javascript 面向对象思想 附源码
2009/07/07 Javascript
javascript 读取xml,写入xml 实现代码
2009/07/10 Javascript
基于Jquery+Ajax+Json的高效分页实现代码
2011/10/29 Javascript
解决用jquery load加载页面到div时,不执行页面js的问题
2014/02/22 Javascript
自己封装的常用javascript函数分享
2015/01/07 Javascript
用模版生成HTML的的框架jquery.tmpl使用详解
2015/01/07 Javascript
JS模拟Dialog弹出浮动框效果代码
2015/10/16 Javascript
解析JavaScript中的字符串类型与字符编码支持
2016/06/24 Javascript
js+css3制作时钟特效
2016/10/16 Javascript
jQuery Validate 校验多个相同name的方法
2017/05/18 jQuery
jQuery实现新闻播报滚动及淡入淡出效果示例
2018/03/23 jQuery
angularJs在多个控制器中共享服务数据的方法
2018/09/30 Javascript
学习使用ExpressJS 4.0中的新Router的用法
2018/11/06 Javascript
关于vue状态过渡transition不起作用的原因解决
2019/04/09 Javascript
Python遍历目录的4种方法实例介绍
2015/04/13 Python
Python计算三角函数之asin()方法的使用
2015/05/15 Python
Python+微信接口实现运维报警
2016/08/27 Python
Python调用系统底层API播放wav文件的方法
2017/08/11 Python
Python字典的基本用法实例分析【创建、增加、获取、修改、删除】
2019/03/05 Python
Django中提供的6种缓存方式详解
2019/08/05 Python
python数值基础知识浅析
2019/11/19 Python
交通专业个人自荐信格式
2013/09/23 职场文书
艺术应用与设计个人的自我评价
2013/11/23 职场文书
优秀驾驶员先进事迹材料
2014/05/04 职场文书
体育馆的标语
2014/06/24 职场文书
风之谷观后感
2015/06/11 职场文书
学生会干部任命书
2015/09/21 职场文书
2016教师年度考核评语大全
2015/12/01 职场文书
go语言中GOPATH GOROOT的作用和设置方式
2021/05/05 Golang