python爬虫教程之爬取百度贴吧并下载的示例


Posted in Python onMarch 07, 2014

测试url:http://tieba.baidu.com/p/27141123322?pn=
begin  1
end   4

import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url:  \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
Python 相关文章推荐
python去掉字符串中重复字符的方法
Feb 27 Python
浅析Python的Django框架中的Memcached
Jul 23 Python
python中的break、continue、exit()、pass全面解析
Aug 05 Python
Tensorflow 利用tf.contrib.learn建立输入函数的方法
Feb 08 Python
Django中使用第三方登录的示例代码
Aug 20 Python
浅谈Django的缓存机制
Aug 23 Python
python+pyqt5实现KFC点餐收银系统
Jan 24 Python
python 阶乘累加和的实例
Feb 01 Python
对Python之gzip文件读写的方法详解
Feb 08 Python
python pandas获取csv指定行 列的操作方法
Jul 12 Python
浅析python内置模块collections
Nov 15 Python
jupyter notebook指定启动目录的方法
Mar 02 Python
python处理json数据中的中文
Mar 06 #Python
Python中针对函数处理的特殊方法
Mar 06 #Python
python连接mysql调用存储过程示例
Mar 05 #Python
python益智游戏计算汉诺塔问题示例
Mar 05 #Python
python连接mysql并提交mysql事务示例
Mar 05 #Python
python遍历文件夹并删除特定格式文件的示例
Mar 05 #Python
python的三目运算符和not in运算符使用示例
Mar 03 #Python
You might like
PHP Smarty生成EXCEL文档的代码
2008/08/23 PHP
PHP网站建设的流程与步骤分享
2015/09/25 PHP
PHP框架性能测试报告
2016/05/08 PHP
PHP查询分页的实现代码
2017/06/09 PHP
laravel ORM 只开启created_at的几种方法总结
2018/01/29 PHP
php微信开发之关键词回复功能
2018/06/13 PHP
PHP获取对象属性的三种方法实例分析
2019/01/03 PHP
使用正则替换变量
2007/05/05 Javascript
JavaScript 学习笔记(七)字符串的连接
2009/12/31 Javascript
基于jQuery实现表格数据的动态添加与统计的代码
2011/01/31 Javascript
基于jQuery的倒计时插件代码
2011/05/07 Javascript
jquery实现全选、不选、反选的两种方法
2016/09/06 Javascript
element 结合vue 在表单验证时有值却提示错误的解决办法
2018/01/22 Javascript
vue-cli 引入jQuery,Bootstrap,popper的方法
2018/09/03 jQuery
Vue实现根据hash高亮选项卡
2019/05/27 Javascript
Layui弹出层 加载 做编辑页面的方法
2019/09/16 Javascript
关于Layui Table隐藏列问题
2019/09/16 Javascript
python之wxPython应用实例
2014/09/28 Python
Python实时获取cmd的输出
2015/12/13 Python
用python的requests第三方模块抓取王者荣耀所有英雄的皮肤实例
2017/12/14 Python
查看python安装路径及pip安装的包列表及路径
2019/04/03 Python
如何运行.ipynb文件的图文讲解
2019/06/27 Python
pytorch中图像的数据格式实例
2020/02/11 Python
PyQt5 文本输入框自动补全QLineEdit的实现示例
2020/05/13 Python
html5 的a标签 Href 拨电话的写法
2013/11/04 HTML / CSS
西班牙太阳镜品牌:Hawkers
2018/03/11 全球购物
中专毕业生求职简历的自我评价
2013/10/21 职场文书
2014年百日安全生产活动总结
2014/05/04 职场文书
学校爱心捐款倡议书
2014/05/13 职场文书
超市开业庆典策划方案
2014/05/14 职场文书
高三励志标语
2014/06/05 职场文书
成本会计实训报告
2014/11/05 职场文书
销售员自我评价
2015/03/11 职场文书
环保建议书作文300字
2015/09/14 职场文书
2019西餐厅创业计划书范文!
2019/07/12 职场文书
导游词之云南丽江-泸沽湖
2019/09/26 职场文书