用Python下载一个网页保存为本地的HTML文件实例


Posted in Python onMay 21, 2018

我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。

比如我们要下载山东大学新闻网的一个页面,该网页如下:

用Python下载一个网页保存为本地的HTML文件实例

实现代码如下:

import urllib.request

def getHtml(url):
 html = urllib.request.urlopen(url).read()
 return html

def saveHtml(file_name, file_content):
 # 注意windows文件命名的禁用符,比如 /
 with open(file_name.replace('/', '_') + ".html", "wb") as f:
  # 写文件用bytes而不是str,所以要转码
  f.write(file_content)

aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)

print("下载成功")

打开相应的目录可以看到这个网页已经被下载保存成功了

用Python下载一个网页保存为本地的HTML文件实例

我们用浏览器打开这个网页文件如下

用Python下载一个网页保存为本地的HTML文件实例

由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。

以上这篇用Python下载一个网页保存为本地的HTML文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python编程flask使用页面模版的方法
Dec 28 Python
Python绘制并保存指定大小图像的方法
Jan 10 Python
Python设计模式之模板方法模式实例详解
Jan 17 Python
opencv实现静态手势识别 opencv实现剪刀石头布游戏
Jan 22 Python
在Python中调用Ping命令,批量IP的方法
Jan 26 Python
python多线程并发实例及其优化
Jun 27 Python
详解PANDAS 数据合并与重塑(join/merge篇)
Jul 09 Python
Python编程中类与类的关系详解
Aug 08 Python
python程序 创建多线程过程详解
Sep 23 Python
利用PyCharm操作Github(仓库新建、更新,代码回滚)
Dec 18 Python
pycharm 代码自动补全的实现方法(图文)
Sep 18 Python
python3美化表格数据输出结果的实现代码
Apr 14 Python
Python读取本地文件并解析网页元素的方法
May 21 #Python
详解Python中的四种队列
May 21 #Python
Python实现的当前时间多加一天、一小时、一分钟操作示例
May 21 #Python
Python自定义函数实现求两个数最大公约数、最小公倍数示例
May 21 #Python
Python基于递归和非递归算法求两个数最大公约数、最小公倍数示例
May 21 #Python
Python常用字符串替换函数strip、replace及sub用法示例
May 21 #Python
Python下使用Scrapy爬取网页内容的实例
May 21 #Python
You might like
Windows下PHP5和Apache的安装与配置
2006/09/05 PHP
带密匙的php加密解密示例分享
2014/01/29 PHP
PHP循环结构实例讲解
2014/02/10 PHP
ExtJS Window 最小化的一种方法
2009/11/18 Javascript
jQuery中on()方法用法实例详解
2015/02/06 Javascript
jquery衣服颜色选取插件效果代码分享
2015/08/28 Javascript
深入理解js promise chain
2016/05/05 Javascript
Bootstrap导航条可点击和鼠标悬停显示下拉菜单
2016/11/25 Javascript
Node.js复制文件的方法示例
2016/12/29 Javascript
js仿小米手机上下滑动效果
2017/02/05 Javascript
微信小程序教程系列之视图层的条件渲染(10)
2017/04/19 Javascript
bootstrap table表格客户端分页实例
2017/08/07 Javascript
解决vue 按钮多次点击重复提交数据问题
2018/05/10 Javascript
解决vue单页路由跳转后scrollTop的问题
2018/09/03 Javascript
简单两步使用node发送qq邮件的方法
2019/03/01 Javascript
JavaScript函数IIFE使用详解
2019/10/21 Javascript
jQuery实现简易QQ聊天框
2020/02/10 jQuery
[01:31:22]DOTA2-DPC中国联赛定级赛 LBZS vs Magma BO3第二场 1月10日
2021/03/11 DOTA
python 中文乱码问题深入分析
2011/03/13 Python
python创建只读属性对象的方法(ReadOnlyObject)
2013/02/10 Python
在Python中使用sort()方法进行排序的简单教程
2015/05/21 Python
Python迭代器定义与简单用法分析
2018/04/30 Python
Python subprocess模块功能与常见用法实例详解
2018/06/28 Python
pandas 使用均值填充缺失值列的小技巧分享
2019/07/04 Python
python修改FTP服务器上的文件名
2019/09/11 Python
python实现把二维列表变为一维列表的方法分析
2019/10/08 Python
用python的turtle模块实现给女票画个小心心
2019/11/23 Python
查看keras各种网络结构各层的名字方式
2020/06/11 Python
浅析数据存储的三种方式 cookie sessionstorage localstorage 的异同
2020/06/04 HTML / CSS
期末自我鉴定
2014/01/23 职场文书
迟到检讨书300字
2014/02/14 职场文书
幼儿园家长寄语
2014/04/02 职场文书
2015年元旦促销方案书
2014/12/09 职场文书
拾金不昧表扬信
2015/01/16 职场文书
小鞋子观后感
2015/06/05 职场文书
Java并发编程之原子性-Atomic的使用
2022/03/16 Java/Android