编程 Python

python爬虫教程之爬取百度贴吧并下载的示例

Posted in Python onMarch 07, 2014

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url：  \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

使用Python编写Linux系统守护进程实例

Feb 03 Python

pygame播放音乐的方法

May 19 Python

Python使用正则表达式抓取网页图片的方法示例

Apr 21 Python

python3.5 tkinter实现页面跳转

Jan 30 Python

利用Python如何生成便签图片详解

Jul 09 Python

python去掉 unicode 字符串前面的u方法

Oct 21 Python

Python 输入一个数字判断成绩分数等级的方法

Nov 15 Python

在Pycharm中将pyinstaller加入External Tools的方法

Jan 16 Python

Python基础之循环语句用法示例【for、while循环】

Mar 23 Python

Python上下文管理器用法及实例解析

Nov 11 Python

Python Socketserver实现FTP文件上传下载代码实例

Mar 27 Python

keras的siamese(孪生网络)实现案例

Jun 12 Python

python处理json数据中的中文

Mar 06 #Python

Python中针对函数处理的特殊方法

Mar 06 #Python

python连接mysql调用存储过程示例

Mar 05 #Python

python益智游戏计算汉诺塔问题示例

Mar 05 #Python

python连接mysql并提交mysql事务示例

Mar 05 #Python

python遍历文件夹并删除特定格式文件的示例

Mar 05 #Python

python的三目运算符和not in运算符使用示例

Mar 03 #Python

You might like

从C/C++迁移到PHP——判断字符类型的函数

2006/10/09 PHP

PHP图片处理之使用imagecopyresampled函数裁剪图片例子

2014/11/19 PHP

html下载本地

2006/06/19 Javascript

javascript &&和||运算法的另类使用技巧

2009/11/28 Javascript

js 变量类型转换常用函数与代码[比较全]

2009/12/01 Javascript

给artDialog 5.02 增加ajax get功能详细介绍

2012/11/13 Javascript

js二级地域选择的实现方法

2013/06/17 Javascript

node.js中Socket.IO的进阶使用技巧

2014/11/04 Javascript

JQuery判断checkbox是否选中及其它复选框操作方法合集

2015/06/01 Javascript

jQuery+PHP实现可编辑表格字段内容并实时保存

2015/10/09 Javascript

JS弹出对话框实现方法(三种方式)

2015/12/18 Javascript

Vue.js学习示例分享

2017/02/05 Javascript

JavaScript基本类型值-Undefined、Null、Boolean

2017/02/23 Javascript

NodeJS收发GET和POST请求的示例代码

2017/08/25 NodeJs

vue项目如何刷新当前页面的方法

2018/05/18 Javascript

vue实例中data使用return包裹的方法

2018/08/27 Javascript

Vue Prop属性功能与用法实例详解

2019/02/23 Javascript

elementUI table表格动态合并的示例代码

2019/05/15 Javascript

详解Python中内置的NotImplemented类型的用法

2015/03/31 Python

python3爬虫之设计签名小程序

2018/06/19 Python

Python多线程原理与用法详解

2018/08/20 Python

python3.6+selenium实现操作Frame中的页面元素

2019/07/16 Python

python3 下载网络图片代码实例

2019/08/27 Python

python matplotlib画盒图、子图解决坐标轴标签重叠的问题

2020/01/19 Python

Python操作PostgreSql数据库的方法(基本的增删改查)

2020/12/29 Python

Original Penguin英国官方网站：美国著名休闲时装品牌

2016/10/30 全球购物

Fossil美国官网：Fossil手表、手袋、珠宝及配件

2017/02/01 全球购物

什么是静态路由？什么是动态路由？各自的特点是什么？

2015/09/16 面试题

平面网站制作专科生的自我评价分享

2013/12/11 职场文书

置业顾问岗位职责

2015/02/09 职场文书

党支部综合考察意见

2015/06/01 职场文书

外出培训学习心得体会

2016/01/18 职场文书

分享几个JavaScript运算符的使用技巧

2021/04/24 Javascript

解决goland 导入项目后import里的包报红问题

2021/05/06 Golang

Python函数中的不定长参数相关知识总结

2021/06/24 Python

vue elementUI批量上传文件

2022/04/26 Vue.js