Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python类继承用法实例分析
May 27 Python
浅谈python数据类型及类型转换
Dec 18 Python
Window10+Python3.5安装opencv的教程推荐
Apr 02 Python
pandas 获取季度,月度,年度首尾日期的方法
Apr 11 Python
Python利用sqlacodegen自动生成ORM实体类示例
Jun 04 Python
PyQt Qt Designer工具的布局管理详解
Aug 07 Python
python3.7实现云之讯、聚合短信平台的短信发送功能
Sep 26 Python
python中的TCP(传输控制协议)用法实例分析
Nov 15 Python
pycharm双击无响应(打不开问题解决办法)
Jan 10 Python
Python使用qrcode二维码库生成二维码方法详解
Feb 17 Python
python环境搭建和pycharm的安装配置及汉化详细教程(零基础小白版)
Aug 19 Python
Python利用matplotlib绘制散点图的新手教程
Nov 05 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
PHP中数组合并的两种方法及区别介绍
2012/09/14 PHP
php while循环控制的简单实例
2016/05/30 PHP
php集成动态口令认证
2016/07/21 PHP
解决php-fpm.service not found问题的办法
2017/06/06 PHP
js写一个字符串转成驼峰的实例
2013/06/21 Javascript
通过JavaScript使Div居中并随网页大小改变而改变
2013/06/24 Javascript
javascript中apply和call方法的作用及区别说明
2014/02/14 Javascript
JavaScript中九种常用排序算法
2014/09/02 Javascript
JS判断网页广告是否被浏览器拦截过滤的代码
2015/04/05 Javascript
Javascript中For In语句用法实例
2015/05/14 Javascript
vue双向数据绑定原理探究(附demo)
2017/01/17 Javascript
js实现三级联动效果(简单易懂)
2017/03/27 Javascript
vue打包相关细节整理(小结)
2018/09/28 Javascript
js cavans实现静态滚动弹幕
2020/05/21 Javascript
vue.js实现简单购物车功能
2020/05/30 Javascript
[05:05]第三天的dota2
2013/07/29 DOTA
[01:14:19]NAVI vs Mineski 2019国际邀请赛淘汰赛 败者组BO1 8.20.mp4
2020/07/19 DOTA
利用Python中的mock库对Python代码进行模拟测试
2015/04/16 Python
Python实现股市信息下载的方法
2015/06/15 Python
python 读取txt中每行数据,并且保存到excel中的实例
2018/04/29 Python
对tf.reduce_sum tensorflow维度上的操作详解
2018/07/26 Python
python之当你发现QTimer不能用时的解决方法
2019/06/21 Python
基于sklearn实现Bagging算法(python)
2019/07/11 Python
django 中的聚合函数,分组函数,F 查询,Q查询
2019/07/25 Python
Python实现二叉树的最小深度的两种方法
2019/09/30 Python
Python基础之字典常见操作经典实例详解
2020/02/26 Python
CSS3实现伪类hover离开时平滑过渡效果示例
2017/08/10 HTML / CSS
HTML5新标签兼容——&gt; 的两种方法
2018/09/12 HTML / CSS
Puccini乌克兰:购买行李箱、女士手袋网上商店
2020/08/06 全球购物
生产班组长岗位职责
2014/01/05 职场文书
参观考察邀请函范文
2014/01/29 职场文书
国家机关领导干部民主生活会对照检查材料思想汇报
2014/09/17 职场文书
计划生育工作汇报
2014/10/28 职场文书
统计工作个人总结
2015/03/03 职场文书
圆明园纪录片观后感
2015/06/03 职场文书
2016年大学迎新晚会工作总结
2015/10/15 职场文书