python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python调用cmd复制文件代码分享
Dec 27 Python
使用python统计文件行数示例分享
Feb 21 Python
Python urls.py的三种配置写法实例详解
Apr 28 Python
Python 操作MySQL详解及实例
Apr 30 Python
Python利用Django如何写restful api接口详解
Jun 08 Python
python 读取鼠标点击坐标的实例
Dec 29 Python
python3实现带多张图片、附件的邮件发送
Aug 10 Python
python numpy数组复制使用实例解析
Jan 10 Python
Python使用py2neo操作图数据库neo4j的方法详解
Jan 13 Python
Python3 集合set入门基础
Feb 10 Python
如何在keras中添加自己的优化器(如adam等)
Jun 19 Python
详解Python+OpenCV绘制灰度直方图
Mar 22 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
不用mod_rewrite直接用php实现伪静态化页面代码
2008/10/04 PHP
关于PHP内存溢出问题的解决方法
2013/06/25 PHP
解析PHP中VC6 X86和VC9 X86的区别及 Non Thread Safe的意思
2013/06/28 PHP
PHP error_log()将错误信息写入一个文件(定义和用法)
2013/10/25 PHP
laravel 4安装及入门图文教程
2014/10/29 PHP
iOS自定义提示弹出框实现类似UIAlertView的效果
2016/11/16 PHP
Thinkphp5+Redis实现商品秒杀代码实例讲解
2020/12/29 PHP
ExtJS TabPanel beforeremove beforeclose使用说明
2010/03/31 Javascript
jquery表格内容筛选实现思路及代码
2013/04/16 Javascript
node.js中的fs.futimes方法使用说明
2014/12/17 Javascript
js+canvas简单绘制圆圈的方法
2016/01/28 Javascript
ionic js 复选框 与普通的 HTML 复选框到底有没区别
2016/06/06 Javascript
微信小程序 解决swiper不显示图片的方法
2017/01/04 Javascript
详解使用vuex进行菜单管理
2017/12/21 Javascript
ES6知识点整理之Proxy的应用实例详解
2019/04/16 Javascript
判断文字超过2行添加展开按钮,未超过则不显示,溢出部分显示省略号
2019/04/28 Javascript
ajax跨域访问遇到的问题及解决方案
2019/05/23 Javascript
理解Python垃圾回收机制
2016/02/12 Python
python cumsum函数的具体使用
2019/07/29 Python
Pandas0.25来了千万别错过这10大好用的新功能
2019/08/07 Python
python实现图片转字符画的完整代码
2021/02/21 Python
html5 web本地存储将取代我们的cookie
2012/12/26 HTML / CSS
html5 http的轮询和Websocket原理
2018/10/19 HTML / CSS
匡威英国官网:Converse英国
2018/12/02 全球购物
一个大学生十年的职业规划
2014/01/17 职场文书
观看《永远的雷锋》心得体会
2014/03/12 职场文书
高三毕业寄语
2014/04/10 职场文书
小学生教师节演讲稿
2014/09/03 职场文书
不服从公司安排检讨书
2014/09/24 职场文书
全国法制宣传日活动总结
2015/05/05 职场文书
单位考核鉴定意见
2015/06/05 职场文书
热血教师观后感
2015/06/10 职场文书
工程进度款催款函
2015/06/24 职场文书
车辆管理制度范本
2015/08/05 职场文书
2019幼儿园感恩节活动策划书
2019/11/28 职场文书
Python使用UDP实现720p视频传输的操作
2021/04/24 Python