Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python获取脚本所在目录的正确方法
Apr 15 Python
Python基于pygame实现的font游戏字体(附源码)
Nov 11 Python
python对象及面向对象技术详解
Jul 19 Python
Python:Scrapy框架中Item Pipeline组件使用详解
Dec 27 Python
Python实现确认字符串是否包含指定字符串的实例
May 02 Python
Python 实现子类获取父类的类成员方法
Jan 11 Python
Python之列表实现栈的工作功能
Jan 28 Python
利用Python对文件夹下图片数据进行批量改名的代码实例
Feb 21 Python
python 利用turtle库绘制笑脸和哭脸的例子
Nov 23 Python
基于Python fminunc 的替代方法
Feb 29 Python
python中round函数如何使用
Jun 19 Python
使用python求斐波那契数列中第n个数的值示例代码
Jul 26 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
Php Mssql操作简单封装支持存储过程
2009/12/11 PHP
Yii2学习笔记之汉化yii设置表单的描述(属性标签attributeLabels)
2017/02/07 PHP
php实现生成带二维码图片并强制下载功能
2018/02/24 PHP
飞鱼(shqlsl) javascript作品集
2006/12/16 Javascript
Javascript 中介者模式实例
2009/12/16 Javascript
jQuery easyui datagrid动态查询数据实例讲解
2013/02/26 Javascript
javascript读写json示例
2014/04/11 Javascript
jquery查找tr td 示例模拟
2014/05/08 Javascript
JS实现从表格中动态删除指定行的方法
2015/03/31 Javascript
js实现带圆角的多级下拉菜单效果
2015/08/28 Javascript
谈谈我对JavaScript原型和闭包系列理解(随手笔记9)
2015/12/24 Javascript
JS实现页面跳转参数不丢失的方法
2016/11/28 Javascript
基于jQuery实现顶部导航栏功能
2016/12/27 Javascript
纯js实现的积木(div层)拖动功能示例
2017/07/19 Javascript
JS实现点击复选框变更DIV显示状态的示例代码
2017/12/18 Javascript
node结合swig渲染摸板的方法
2018/04/11 Javascript
常见的浏览器存储方式(cookie、localStorage、sessionStorage)
2019/05/07 Javascript
javascript+css实现俄罗斯方块小游戏
2020/06/28 Javascript
js+css3实现简单时钟特效
2020/09/13 Javascript
[01:11]辉夜杯战队访谈宣传片—CDEC.Y
2015/12/26 DOTA
Python实现信用卡系统(支持购物、转账、存取钱)
2016/06/24 Python
python中实现迭代器(iterator)的方法示例
2017/01/19 Python
Python3使用正则表达式爬取内涵段子示例
2018/04/22 Python
Python中交换两个元素的实现方法
2018/06/29 Python
在pycharm中使用git版本管理以及同步github的方法
2019/01/16 Python
PyTorch如何搭建一个简单的网络
2020/08/24 Python
python 模拟登陆163邮箱
2020/12/15 Python
python基于Kivy写一个图形桌面时钟程序
2021/01/28 Python
英国翻新电子产品购物网站:Tech Trade
2017/12/25 全球购物
C&A巴西网上商店:时尚、衣服、手机和鞋子
2020/06/07 全球购物
文秘专业大学生求职信
2013/11/10 职场文书
信用社员工先进事迹材料
2014/02/04 职场文书
大堂副理的岗位职责范文
2014/02/17 职场文书
学生穿着不得体检讨书
2014/10/12 职场文书
欧也妮葛朗台读书笔记
2015/06/30 职场文书
Python语法学习之进程的创建与常用方法详解
2022/04/08 Python