Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python中Switch/Case实现的示例代码
Nov 09 Python
Python语言实现百度语音识别API的使用实例
Dec 13 Python
Flask框架web开发之零基础入门
Dec 10 Python
Python这样操作能存储100多万行的xlsx文件
Apr 16 Python
python 将字符串完成特定的向右移动方法
Jun 11 Python
python sklearn库实现简单逻辑回归的实例代码
Jul 01 Python
ubuntu 安装pyqt5和卸载pyQt5的方法
Mar 24 Python
python 将视频 通过视频帧转换成时间实例
Apr 23 Python
tensorflow从ckpt和从.pb文件读取变量的值方式
May 26 Python
浅谈优化Django ORM中的性能问题
Jul 09 Python
一文详述 Python 中的 property 语法
Sep 01 Python
Python echarts实现数据可视化实例详解
Mar 03 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
fleaphp rolesNameField bug解决方法
2011/04/23 PHP
解析php中static,const与define的使用区别
2013/06/18 PHP
Win10 下安装配置IIS + MySQL + nginx + php7.1.7
2017/08/04 PHP
thinkphp3.2框架中where条件查询用法总结
2019/08/13 PHP
IE innerHTML,outerHTML所引起的问题
2009/06/04 Javascript
jquery创建并行对象或者合并对象的实现代码
2012/10/10 Javascript
模拟电子签章盖章效果的jQuery插件源码
2013/06/24 Javascript
jQuery.parseJSON(json)将JSON字符串转换成js对象
2014/07/27 Javascript
Javascript中的默认参数详解
2014/10/22 Javascript
教你如何使用node.js制作代理服务器
2014/11/26 Javascript
JavaScript限定图片显示大小的方法
2015/03/11 Javascript
13个PHP函数超实用
2015/10/21 Javascript
Javascript实现页面滚动时导航智能定位
2017/05/06 Javascript
js实现数组和对象的深浅拷贝
2017/09/30 Javascript
Sublime Text新建.vue模板并高亮(图文教程)
2017/10/26 Javascript
vue项目刷新当前页面的三种方法
2018/12/04 Javascript
小程序开发踩坑:页面窗口定位(相对于浏览器定位)(推荐)
2019/04/25 Javascript
vue实现简单的日历效果
2020/09/24 Javascript
小程序卡片切换效果组件wxCardSwiper的实现
2020/02/13 Javascript
[01:06]DOTA2隆重推出2016冬季勇士令状 内含上海特级锦标赛互动指南
2016/02/17 DOTA
python中MySQLdb模块用法实例
2014/11/10 Python
Numpy掩码式数组详解
2018/04/17 Python
微信小程序python用户认证的实现
2019/07/29 Python
python爬虫刷访问量 2019 7月
2019/08/01 Python
python定位xpath 节点位置的方法
2019/08/27 Python
解决Django删除migrations文件夹中的文件后出现的异常问题
2019/08/31 Python
Python爬虫爬取微信朋友圈
2020/08/06 Python
Python 按比例获取样本数据或执行任务的实现代码
2020/12/03 Python
班长岗位职责
2013/11/10 职场文书
医药学专业大学生职业生涯规划书论文
2014/01/21 职场文书
《有趣的发现》教学反思
2014/04/15 职场文书
Golang中异常处理机制详解
2021/06/08 Golang
详解Oracle块修改跟踪功能
2021/11/07 Oracle
如何用vue实现网页截图你知道吗
2021/11/17 Vue.js
2021年国漫热度排行前十,完美世界上榜,第四是美国动画作品
2022/03/18 国漫
MySQL实战记录之如何快速定位慢SQL
2022/03/23 MySQL