Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python中的闭包详细介绍和实例
Nov 21 Python
Python实现批量执行同目录下的py文件方法
Jan 11 Python
python使用正则筛选信用卡
Jan 27 Python
Python中字符串List按照长度排序
Jul 01 Python
python re.sub()替换正则的匹配内容方法
Jul 22 Python
使用Python函数进行模块化的实现
Nov 15 Python
flask的orm框架SQLAlchemy查询实现解析
Dec 12 Python
pytorch数据预处理错误的解决
Feb 20 Python
完美解决keras保存好的model不能成功加载问题
Jun 11 Python
Tensorflow tensor 数学运算和逻辑运算方式
Jun 30 Python
基于tensorflow for循环 while循环案例
Jun 30 Python
Python如何使用input函数获取输入
Aug 06 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
php获取文件大小的方法
2014/02/26 PHP
PHP文件生成的图片无法使用CDN缓存的解决方法
2015/06/20 PHP
php中简单的对称加密算法实现
2017/01/05 PHP
PHP PDOStatement::getAttribute讲解
2019/02/01 PHP
JS启动应用程序的一个简单例子
2008/05/11 Javascript
jquery之Document元素选择器篇
2008/08/14 Javascript
一些常用的JS功能函数代码
2009/06/23 Javascript
DIY jquery plugin - tabs标签切换实现代码
2010/12/11 Javascript
善用事件代理,警惕闭包的性能陷阱。
2011/01/20 Javascript
javascript中length属性的探索
2011/07/31 Javascript
Javascript实现单例模式
2016/01/24 Javascript
request请求获取参数的实现方法(post和get两种方式)
2016/09/27 Javascript
jQuery使用zTree插件实现可拖拽的树示例
2017/09/23 jQuery
微信小程序实现用table显示数据库反馈的多条数据功能示例
2019/05/07 Javascript
解决jquery validate 验证不通过后验证正确的信息仍残留在label上的方法
2019/08/27 jQuery
vue实现配置全局访问路径头(axios)
2019/11/01 Javascript
python WindowsError的错误代码详解
2017/07/23 Python
python 调用c语言函数的方法
2017/09/29 Python
使用apidoc管理RESTful风格Flask项目接口文档方法
2018/02/07 Python
python计算两个数的百分比方法
2018/06/29 Python
python实现指定文件夹下的指定文件移动到指定位置
2018/09/17 Python
python opencv捕获摄像头并显示内容的实现
2019/07/11 Python
Django url,从一个页面调到另个页面的方法
2019/08/21 Python
vscode 配置 python3开发环境的方法
2019/09/19 Python
给我一面国旗 python帮你实现
2019/09/30 Python
Cinque网上商店:德国服装品牌
2019/03/17 全球购物
俄罗斯电子产品在线商店:UltraTrade
2020/01/30 全球购物
初中考试作弊检讨书
2014/02/01 职场文书
xxx同志考察材料
2014/02/07 职场文书
治庸问责心得体会
2014/09/12 职场文书
婚礼答谢词
2015/01/04 职场文书
优秀英文求职信范文
2015/03/19 职场文书
工厂门卫岗位职责
2015/04/13 职场文书
少年犯观后感
2015/06/11 职场文书
董事长新年致辞
2015/07/29 职场文书
小学记事作文之200字
2019/08/06 职场文书