Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python中文编码问题小结
Sep 28 Python
Python中的迭代器漫谈
Feb 03 Python
python使用socket向客户端发送数据的方法
Apr 29 Python
在Python中使用成员运算符的示例
May 13 Python
实例讲解Python中global语句下全局变量的值的修改
Jun 16 Python
Python闭包的两个注意事项(推荐)
Mar 20 Python
pandas DataFrame 根据多列的值做判断,生成新的列值实例
May 18 Python
Python 带有参数的装饰器实例代码详解
Dec 06 Python
选择python进行数据分析的理由和优势
Jun 25 Python
python在openstreetmap地图上绘制路线图的实现
Jul 11 Python
使用PyCharm进行远程开发和调试的实现
Nov 04 Python
Python 正则模块详情
Nov 02 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
使用Apache的rewrite技术
2006/06/22 PHP
php,ajax实现分页
2008/03/27 PHP
PHP正则替换函数preg_replace和preg_replace_callback使用总结
2014/09/22 PHP
分享常见的几种页面静态化的方法
2015/01/08 PHP
php使用cookie保存用户登录的用户名实例
2015/01/26 PHP
PHP实现的带超时功能get_headers函数
2015/02/10 PHP
php实现paypal 授权登录
2015/05/28 PHP
第一篇初识bootstrap
2016/06/21 Javascript
jQuery实现倒计时(倒计时年月日可自己输入)
2016/12/02 Javascript
vue+node+webpack环境搭建教程
2017/11/05 Javascript
解决linux下node.js全局模块找不到的问题
2018/05/15 Javascript
React组件内事件传参实现tab切换的示例代码
2018/07/04 Javascript
详解ES6 Symbol 的用途
2018/10/14 Javascript
vue mounted 调用两次的完美解决办法
2018/10/29 Javascript
JavaScript算法学习之冒泡排序和选择排序
2019/11/02 Javascript
Python函数参数类型*、**的区别
2015/04/11 Python
Python生成随机验证码的两种方法
2015/12/22 Python
Python并发编程协程(Coroutine)之Gevent详解
2017/12/27 Python
Python实现的三层BP神经网络算法示例
2018/02/07 Python
Python图像处理之颜色的定义与使用分析
2019/01/03 Python
python图像处理入门(一)
2019/04/04 Python
美国创意之家:BulbHead
2017/07/12 全球购物
MCAKE蛋糕官方网站:一直都是巴黎的味道
2018/02/06 全球购物
Footshop罗马尼亚:最好的运动鞋选择
2019/09/10 全球购物
介绍一下linux文件系统分配策略
2012/11/17 面试题
《手指教学》反思
2014/02/14 职场文书
艺术学院毕业生自我评价
2014/03/02 职场文书
作风建设年度心得体会
2014/10/29 职场文书
社区文明创建工作总结2015
2015/04/21 职场文书
三国演义读书笔记
2015/06/25 职场文书
工作简报格式范文
2015/07/21 职场文书
想要创业,那么你做好准备了吗?
2019/07/01 职场文书
浅谈Web Storage API的使用
2021/06/23 Javascript
浅谈Python中的正则表达式
2021/06/28 Python
python pygame 开发五子棋双人对弈
2022/05/02 Python
如何利用python创作字符画
2022/06/25 Python