Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
35个Python编程小技巧
Apr 01 Python
python自动安装pip
Apr 24 Python
python继承和抽象类的实现方法
Jan 14 Python
Numpy中转置transpose、T和swapaxes的实例讲解
Apr 17 Python
解决Tensorflow使用pip安装后没有model目录的问题
Jun 13 Python
Python拼接字符串的7种方法总结
Nov 01 Python
浅谈Python中的全局锁(GIL)问题
Jan 11 Python
利用django+wechat-python-sdk 创建微信服务器接入的方法
Feb 20 Python
PyCharm中代码字体大小调整方法
Jul 29 Python
详解torch.Tensor的4种乘法
Sep 03 Python
python获取本周、上周、本月、上月及本季的时间代码实例
Sep 08 Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
第七章 php自定义函数实现代码
2011/12/30 PHP
Laravel框架FormRequest中重写错误处理的方法
2019/02/18 PHP
HTML TO JavaScript 转换
2006/06/26 Javascript
基于jquery的inputlimiter 实现字数限制功能
2010/05/30 Javascript
JQuery1.6 使用方法三
2011/11/23 Javascript
js获取指定日期前后的日期代码
2013/08/20 Javascript
关闭浏览器时提示onbeforeunload事件
2013/12/25 Javascript
JavaScript实现定时隐藏与显示图片的方法
2015/08/06 Javascript
为什么JavaScript没有块级作用域
2016/05/22 Javascript
Javascript之Math对象详解
2016/06/07 Javascript
如何使用headjs来管理和异步加载js
2016/11/29 Javascript
详解js中==与===的区别
2017/01/08 Javascript
js鼠标经过tab选项卡时实现切换延迟
2017/03/24 Javascript
iOS + node.js使用Socket.IO框架进行实时通信示例
2017/04/14 Javascript
jQuery图片查看插件Magnify开发详解
2017/12/25 jQuery
vue-cli 如何打包上线的方法示例
2018/05/08 Javascript
基于JavaScript实现简单抽奖功能代码实例
2020/10/20 Javascript
使用简单工厂模式来进行Python的设计模式编程
2016/03/01 Python
python爬虫入门教程--利用requests构建知乎API(三)
2017/05/25 Python
Python使用文件锁实现进程间同步功能【基于fcntl模块】
2017/10/16 Python
django中间键重定向实例方法
2019/11/10 Python
PyQt5连接MySQL及QMYSQL driver not loaded错误解决
2020/04/29 Python
scrapy框架携带cookie访问淘宝购物车功能的实现代码
2020/07/07 Python
python regex库实例用法总结
2021/01/03 Python
html5的画布canvas——画出弧线、旋转的图形实例代码+效果图
2013/06/09 HTML / CSS
可靠的数据流传输TCP
2016/03/15 面试题
木工主管岗位职责
2013/12/08 职场文书
先进个人获奖感言
2014/01/24 职场文书
2014年入党积极分子党课学习心得体会模板
2014/04/03 职场文书
电子专业求职信
2014/06/19 职场文书
合作意向书
2014/07/30 职场文书
知识就是力量演讲稿
2014/09/13 职场文书
授权委托书
2014/09/17 职场文书
幼师大班个人总结
2015/02/13 职场文书
Laravel中获取IP的真实地理位置
2021/04/01 PHP
nginx负载功能+nfs服务器功能解析
2022/02/28 Servers