Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
简单的Python抓taobao图片爬虫
Oct 26 Python
Python标准库之循环器(itertools)介绍
Nov 25 Python
python访问类中docstring注释的实现方法
May 04 Python
python的else子句使用指南
Feb 27 Python
python检测空间储存剩余大小和指定文件夹内存占用的实例
Jun 11 Python
详解Django中CBV(Class Base Views)模型源码分析
Feb 25 Python
python,Django实现的淘宝客登录功能示例
Jun 12 Python
flask框架配置mysql数据库操作详解
Nov 29 Python
appium+python adb常用命令分享
Mar 06 Python
Django如何批量创建Model
Sep 01 Python
Python基础之hashlib模块详解
May 06 Python
Python - 10行代码集2000张美女图
May 23 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
PHP中的reflection反射机制测试例子
2014/08/05 PHP
jQuery EasyUI 开源插件套装 完全替代ExtJS
2010/03/24 Javascript
顶部缓冲下拉菜单导航特效的JS代码
2013/08/27 Javascript
jQuery使用prepend()方法在元素前添加内容用法实例
2015/03/26 Javascript
每天一篇javascript学习小结(面向对象编程)
2015/11/20 Javascript
javascript动态获取登录时间和在线时长
2016/02/25 Javascript
详解AngularJS过滤器的使用
2016/03/11 Javascript
Angularjs结合Bootstrap制作的一个TODO List
2016/08/18 Javascript
微信开发 JS-SDK 6.0.2 经常遇到问题总结
2016/12/08 Javascript
jQuery获取选中单选按钮radio的值
2016/12/27 Javascript
js中数组插入、删除元素操作的方法
2017/02/15 Javascript
BootStrap的select2既可以查询又可以输入的实现代码
2017/02/17 Javascript
Bootstrap响应式导航由768px变成992px的实现代码
2017/06/15 Javascript
微信小程序 循环及嵌套循环的使用总结
2017/09/26 Javascript
微信小程序wx.getImageInfo()如何获取图片信息
2018/01/26 Javascript
从零开始实现Vue简单的Toast插件
2018/12/03 Javascript
vue使用vuex实现首页导航切换不同路由的方法
2019/05/08 Javascript
微信小程序 拍照或从相册选取图片上传代码实例
2019/08/28 Javascript
vue动态渲染svg、添加点击事件的实现
2020/03/13 Javascript
[53:52]EG vs VGJ.T 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
Python中使用items()方法返回字典元素对的教程
2015/05/21 Python
python类中super()和__init__()的区别
2016/10/18 Python
浅谈python中真正关闭socket的方法
2018/12/18 Python
一步步教你用python的scrapy编写一个爬虫
2019/04/17 Python
python 梯度法求解函数极值的实例
2019/07/10 Python
HTML5之tabindex属性全面解析
2016/07/07 HTML / CSS
澳大利亚人信任的清洁平台,您的私人管家:Jarvis
2020/12/25 全球购物
莫斯科珠宝厂官方网站:Miuz
2020/09/19 全球购物
运行时异常与一般异常有何异同?
2014/01/05 面试题
大一期末自我鉴定
2013/12/13 职场文书
离职证明标准格式
2014/09/15 职场文书
小学校园广播稿(3篇)
2014/09/19 职场文书
战马观后感
2015/06/08 职场文书
微信早安问候语
2015/11/10 职场文书
ORACLE查看当前账号的相关信息
2021/06/18 Oracle
python高温预警数据获取实例
2022/07/23 Python