Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
初学Python函数的笔记整理
Apr 07 Python
Python中的super用法详解
May 28 Python
python3实现逐字输出的方法
Jan 23 Python
手把手教你pycharm专业版安装破解教程(linux版)
Sep 26 Python
python pip安装包出现:Failed building wheel for xxx错误的解决
Dec 25 Python
Python测试线程应用程序过程解析
Dec 31 Python
PyTorch的SoftMax交叉熵损失和梯度用法
Jan 15 Python
Django使用Celery加redis执行异步任务的实例内容
Feb 20 Python
python zip()函数的使用示例
Sep 23 Python
Python pip 常用命令汇总
Oct 19 Python
Python图像读写方法对比
Nov 16 Python
python3实现名片管理系统(控制台版)
Nov 29 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
PHP表单提交后引号前自动加反斜杠的原因及三种办法关闭php魔术引号
2015/09/30 PHP
PHP中ltrim与rtrim去除左右空格及特殊字符实例
2016/01/07 PHP
php base64 编码与解码实例代码
2017/03/21 PHP
Yii2数据库操作常用方法小结
2017/05/04 PHP
PHP使用PDO创建MySQL数据库、表及插入多条数据操作示例
2019/05/30 PHP
PHP实现时间日期友好显示实现代码
2019/09/08 PHP
TP5框架简单登录功能实现方法示例
2019/10/31 PHP
js获取变量
2006/08/24 Javascript
XHTML下,JS浮动代码失效的问题
2009/11/12 Javascript
ExtJS的FieldSet的column列布局
2009/11/20 Javascript
JQuery给select添加/删除节点的实现代码
2016/04/26 Javascript
angular 基于ng-messages的表单验证实例
2017/05/04 Javascript
了解VUE的render函数的使用
2017/06/08 Javascript
Node.js 使用axios读写influxDB的方法示例
2018/10/26 Javascript
详解vue项目中实现图片裁剪功能
2019/06/07 Javascript
Javascript 对象(object)合并操作实例分析
2019/07/30 Javascript
vue动态加载SVG文件并修改节点数据的操作代码
2020/08/17 Javascript
浅谈vant组件Picker 选择器选单选问题
2020/11/04 Javascript
python访问纯真IP数据库的代码
2011/05/19 Python
详解使用Python处理文件目录的相关方法
2015/10/16 Python
Django实现组合搜索的方法示例
2018/01/23 Python
numpy使用fromstring创建矩阵的实例
2018/06/15 Python
Python登录系统界面实现详解
2019/06/25 Python
python列表推导式入门学习解析
2019/12/02 Python
TensorFlow MNIST手写数据集的实现方法
2020/02/05 Python
CSS3 clip-path 用法介绍详解
2018/03/01 HTML / CSS
Java里面如何把一个Array数组转换成Collection, List
2013/07/26 面试题
高一英语教学反思
2014/01/22 职场文书
团日活动总结
2014/04/28 职场文书
县政协领导班子群众路线教育实践活动四风问题整改方案
2014/10/26 职场文书
小班下学期个人总结
2015/02/12 职场文书
2015年后勤工作总结范文
2015/04/08 职场文书
高中体育课教学反思
2016/02/16 职场文书
JS Object构造函数之Object.freeze
2021/04/28 Javascript
python基础之类方法和静态方法
2021/10/24 Python
本地搭建minio文件服务器(使用bat脚本启动)的方法
2022/07/15 Servers