Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python函数参数类型*、**的区别
Apr 11 Python
使用python3+xlrd解析Excel的实例
May 04 Python
对Python subprocess.Popen子进程管道阻塞详解
Oct 29 Python
python for 循环获取index索引的方法
Feb 01 Python
python中的colorlog库使用详解
Jul 05 Python
TensorFlow实现简单的CNN的方法
Jul 18 Python
用Pelican搭建一个极简静态博客系统过程解析
Aug 22 Python
python 和c++实现旋转矩阵到欧拉角的变换方式
Dec 04 Python
python邮件中附加文字、html、图片、附件实现方法
Jan 04 Python
pdf论文中python画的图Type 3 fonts字体不兼容的解决方案
Apr 24 Python
Django开发RESTful API实现增删改查(入门级)
May 10 Python
使用pycharm运行flask应用程序的详细教程
Jun 07 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
php小偷相关截取函数备忘
2010/11/28 PHP
Laravel框架学习笔记(二)项目实战之模型(Models)
2014/10/15 PHP
Thinkphp 框架基础之源码获取、环境要求与目录结构分析
2020/04/27 PHP
表格 隔行换色升级版
2009/11/07 Javascript
jquery 操作DOM案例代码分享
2012/04/05 Javascript
使用js正则控制input标签只允许输入的值
2013/07/29 Javascript
jQuery 仿百度输入标签插件附效果图
2014/07/04 Javascript
javascript每日必学之运算符
2016/02/16 Javascript
javascript汉字拼音互转的简单实例
2016/10/09 Javascript
Webpack如何引入bootstrap的方法
2017/06/17 Javascript
webpack学习--webpack经典7分钟入门教程
2017/06/28 Javascript
JavaScript实现的原生态兼容IE6可调可控滚动文字功能详解
2017/09/19 Javascript
jQuery实现简单的回到顶部totop功能示例
2017/10/16 jQuery
js使用formData实现批量上传
2020/03/27 Javascript
详解vue组件中使用路由方法
2019/02/12 Javascript
tweenjs缓动算法的使用实例分析
2019/08/26 Javascript
详解js文件通过python访问数据库方法
2019/03/03 Python
Python第三方库face_recognition在windows上的安装过程
2019/05/03 Python
PyQt5.6+pycharm配置以及pyinstaller生成exe(小白教程)
2020/06/02 Python
Gap工厂店:Gap Factory
2017/11/02 全球购物
澳大利亚家具和家居用品购物网站:Zanui
2018/12/29 全球购物
英国DIY和家居装饰领域的主要品牌:Wickes
2019/11/26 全球购物
UNIX文件名称有什么规定
2013/03/25 面试题
实习护士自我鉴定
2013/10/13 职场文书
网络工程专业毕业生推荐信
2013/10/28 职场文书
毕业自荐信
2013/12/16 职场文书
函授本科自我鉴定
2014/02/04 职场文书
公路绿化方案
2014/05/12 职场文书
奉献爱心演讲稿
2014/09/04 职场文书
教师党的群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
小学生暑假安全公约
2015/07/14 职场文书
追悼会答谢词范文
2015/09/29 职场文书
python某漫画app逆向
2021/03/31 Python
为什么mysql字段要使用NOT NULL
2021/05/13 MySQL
MySQL通过binlog恢复数据
2021/05/27 MySQL
微信小程序实现聊天室功能
2021/06/14 Javascript