python爬虫教程之爬取百度贴吧并下载的示例


Posted in Python onMarch 07, 2014

测试url:http://tieba.baidu.com/p/27141123322?pn=
begin  1
end   4

import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url:  \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
Python 相关文章推荐
Python发送email的3种方法
Apr 28 Python
Python中的is和==比较两个对象的两种方法
Sep 06 Python
Python输出由1,2,3,4组成的互不相同且无重复的三位数
Feb 01 Python
Django 根据数据模型models创建数据表的实例
May 27 Python
详解Python 解压缩文件
Apr 09 Python
Python常用模块之requests模块用法分析
May 15 Python
Python GUI编程 文本弹窗的实例
Jun 11 Python
Python re正则表达式元字符分组()用法分享
Feb 10 Python
python数据分析:关键字提取方式
Feb 24 Python
python3 使用openpyxl将mysql数据写入xlsx的操作
May 15 Python
深入了解Python 变量作用域
Jul 24 Python
Linux系统下升级pip的完整步骤
Jan 31 Python
python处理json数据中的中文
Mar 06 #Python
Python中针对函数处理的特殊方法
Mar 06 #Python
python连接mysql调用存储过程示例
Mar 05 #Python
python益智游戏计算汉诺塔问题示例
Mar 05 #Python
python连接mysql并提交mysql事务示例
Mar 05 #Python
python遍历文件夹并删除特定格式文件的示例
Mar 05 #Python
python的三目运算符和not in运算符使用示例
Mar 03 #Python
You might like
什么是MVC,好东西啊
2007/05/03 PHP
php 遍历显示文件夹下所有目录、所有文件的函数,没有分页的代码
2008/11/14 PHP
DISCUZ 论坛管理员密码忘记的解决方法
2009/05/14 PHP
Yii2中使用asset压缩js,css文件的方法
2016/11/24 PHP
详解php反序列化
2020/06/10 PHP
javascript显示选择目录对话框的代码
2008/11/10 Javascript
在UpdatePanel内jquery easyui效果失效的解决方法
2010/04/11 Javascript
jQuery(1.6.3) 中css方法对浮动的实现缺陷分析
2011/09/09 Javascript
jQuery实现灰蓝风格标准二级下拉菜单效果代码
2015/08/31 Javascript
基于javascript实现图片懒加载
2016/01/05 Javascript
原生js编写焦点图效果
2016/12/08 Javascript
jQuery实现鼠标点击处心形漂浮的炫酷效果示例
2018/04/12 jQuery
jQuery实现鼠标移到某个对象时弹出显示层功能
2018/08/23 jQuery
对vue中的事件穿透与禁止穿透实例详解
2019/10/28 Javascript
一起来了解一下JavaScript的预编译(小结)
2021/03/01 Javascript
[31:00]2014 DOTA2华西杯精英邀请赛5 24 NewBee VS iG
2014/05/25 DOTA
[00:12]2018DOTA2亚洲邀请赛 Sccc亮相SOLO赛,今年他又会有什么样的战绩?
2018/04/06 DOTA
举例讲解Python的lambda语句声明匿名函数的用法
2016/07/01 Python
Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】
2017/06/20 Python
Python中字典的浅拷贝与深拷贝用法实例分析
2018/01/02 Python
python ftp 按目录结构上传下载的实现代码
2018/09/12 Python
Python3中urlencode和urldecode的用法详解
2019/07/23 Python
Python 动态变量名定义与调用方法
2020/02/09 Python
pytorch 实现在一个优化器中设置多个网络参数的例子
2020/02/20 Python
HTML5手指下滑弹出负一屏阻止移动端浏览器内置下拉刷新功能的实现代码
2020/04/10 HTML / CSS
AmazeUI在模态框中嵌入表单形成模态输入框
2020/08/20 HTML / CSS
班级入场式解说词
2014/02/01 职场文书
元旦联欢会感言
2014/03/04 职场文书
聘用意向书
2014/07/29 职场文书
白鹤梁导游词
2015/02/06 职场文书
深入探讨opencv图像矫正算法实战
2021/05/21 Python
Java生成读取条形码和二维码的简单示例
2021/07/09 Java/Android
MySQL 数据类型详情
2021/11/11 MySQL
JavaWeb实现显示mysql数据库数据
2022/03/19 Java/Android
解决xampp安装后Apache无法启动
2022/03/21 Servers
如何更改Win11声音输出设备?Win11声音输出设备四种更改方法
2022/04/08 数码科技