python爬虫教程之爬取百度贴吧并下载的示例


Posted in Python onMarch 07, 2014

测试url:http://tieba.baidu.com/p/27141123322?pn=
begin  1
end   4

import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url:  \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
Python 相关文章推荐
python实现决策树
Dec 21 Python
对dataframe进行列相加,行相加的实例
Jun 08 Python
python检测空间储存剩余大小和指定文件夹内存占用的实例
Jun 11 Python
浅谈Python的list中的选取范围
Nov 12 Python
python文件拆分与重组实例
Dec 10 Python
解决Python中list里的中文输出到html模板里的问题
Dec 17 Python
利用python如何在前程无忧高效投递简历
May 07 Python
Python button选取本地图片并显示的实例
Jun 13 Python
TensorFlow 多元函数的极值实例
Feb 10 Python
Python @property及getter setter原理详解
Mar 31 Python
django model 条件过滤 queryset.filter(**condtions)用法详解
May 20 Python
pytorch实现ResNet结构的实例代码
May 17 Python
python处理json数据中的中文
Mar 06 #Python
Python中针对函数处理的特殊方法
Mar 06 #Python
python连接mysql调用存储过程示例
Mar 05 #Python
python益智游戏计算汉诺塔问题示例
Mar 05 #Python
python连接mysql并提交mysql事务示例
Mar 05 #Python
python遍历文件夹并删除特定格式文件的示例
Mar 05 #Python
python的三目运算符和not in运算符使用示例
Mar 03 #Python
You might like
PHP5 安装方法
2007/01/15 PHP
php重定向的三种方法分享
2012/02/22 PHP
PHP数据库调用类调用实例(详细注释)
2012/07/12 PHP
php 操作数组(合并,拆分,追加,查找,删除等)
2012/07/20 PHP
php处理json格式数据经典案例总结
2016/05/19 PHP
PHP微信支付实例解析
2016/07/22 PHP
PHP使用SWOOLE扩展实现定时同步 MySQL 数据
2017/04/09 PHP
PhotoShop给图片自动添加边框及EXIF信息的JS脚本
2015/02/15 Javascript
JavaScript数据类型详解
2015/04/01 Javascript
详解JavaScript中setSeconds()方法的使用
2015/06/11 Javascript
JS简单获取当前日期和农历日期的方法
2017/04/17 Javascript
js 获取元素的具体样式信息getcss(实例讲解)
2017/07/05 Javascript
JS返回顶部实例代码
2020/08/09 Javascript
js隐式转换的知识实例讲解
2018/09/28 Javascript
vuex 动态注册方法 registerModule的实现
2019/07/03 Javascript
js如何验证密码强度
2020/03/18 Javascript
浅谈Vue3.0新版API之composition-api入坑指南
2020/04/30 Javascript
JavaScript实现页面高亮操作提示和蒙板
2021/01/04 Javascript
python中getattr函数使用方法 getattr实现工厂模式
2014/01/20 Python
在Python中使用lambda高效操作列表的教程
2015/04/24 Python
Python对list列表结构中的值进行去重的方法总结
2016/05/07 Python
详解Python读取配置文件模块ConfigParser
2017/05/11 Python
pandas apply 函数 实现多进程的示例讲解
2018/04/20 Python
python得到qq句柄,并显示在前台的方法
2018/10/14 Python
Python实现的列表排序、反转操作示例
2019/03/13 Python
Python爬取知乎图片代码实现解析
2019/09/17 Python
Python 50行爬虫抓取并处理图灵书目过程详解
2019/09/20 Python
查看jupyter notebook每个单元格运行时间实例
2020/04/22 Python
WWE美国职业摔角官方商店:WWE Shop
2018/11/15 全球购物
意大利奢侈品综合电商网站:MODES
2019/12/14 全球购物
活动邀请函范文
2014/01/19 职场文书
医药销售求职信范文
2014/02/01 职场文书
生活小常识广播稿
2014/09/16 职场文书
2014教师年度思想工作总结
2014/11/10 职场文书
2016元旦晚会主持词开场白和结束语
2015/12/04 职场文书
创业计划书之蛋糕店
2019/08/29 职场文书