python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python编写一个在Linux下实现截图分享的脚本的教程
Apr 24 Python
Python 3.x 连接数据库示例(pymysql 方式)
Jan 19 Python
多版本Python共存的配置方法
May 22 Python
python版简单工厂模式
Oct 16 Python
Python机器学习之决策树算法实例详解
Dec 06 Python
Python自定义函数定义,参数,调用代码解析
Dec 27 Python
使用DataFrame删除行和列的实例讲解
Apr 08 Python
让你的Python代码实现类型提示功能
Nov 19 Python
python redis 批量设置过期key过程解析
Nov 26 Python
Python字符串的修改方法实例
Dec 19 Python
python GUI库图形界面开发之PyQt5浏览器控件QWebEngineView详细使用方法
Feb 26 Python
Python 机器学习工具包SKlearn的安装与使用
May 14 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
php过滤危险html代码
2008/08/18 PHP
10条PHP高级技巧[修正版]
2011/08/02 PHP
PHP页面实现定时跳转的方法
2014/10/31 PHP
php实现猴子选大王问题算法实例
2015/04/20 PHP
php mysql PDO 查询操作的实例详解
2017/09/23 PHP
java script编程起步(第三课)
2007/01/10 Javascript
jQuery '行 4954 错误: 不支持该属性或方法' 的问题解决方法
2011/01/19 Javascript
简体中文转换繁体中文(实现代码)
2013/12/25 Javascript
网站接入QQ登录的两种方法
2014/07/22 Javascript
JS简单操作select和dropdownlist实例
2014/11/26 Javascript
浅析JS获取url中的参数实例代码
2016/06/14 Javascript
从零开始学习Node.js系列教程六:EventEmitter发送和接收事件的方法示例
2017/04/13 Javascript
学习使用Bootstrap栅格系统
2017/05/11 Javascript
bootstrap多层模态框滚动条消失的问题
2017/07/21 Javascript
基于BootStrap multiselect.js实现的下拉框联动效果
2017/07/28 Javascript
微信小程序使用audio组件播放音乐功能示例【附源码下载】
2017/12/08 Javascript
vue源码解析之事件机制原理
2018/04/21 Javascript
VScode格式化ESlint方法(最全最好用方法)
2019/09/10 Javascript
解决$store.getters调用不执行的问题
2019/11/08 Javascript
python编程-将Python程序转化为可执行程序[整理]
2007/04/09 Python
Python修改Excel数据的实例代码
2013/11/01 Python
使用Python构建Hopfield网络的教程
2015/04/14 Python
如何基于matlab相机标定导出xml文件
2020/11/02 Python
vue.js刷新当前页面的实例讲解
2020/12/29 Python
css3实例教程 一款纯css3实现的环形导航菜单
2014/10/20 HTML / CSS
加拿大最大的体育用品、鞋类和服装零售商:Sport Chek
2018/11/29 全球购物
应聘医药代表职位求职信
2013/10/21 职场文书
个人简历自荐信
2013/12/05 职场文书
企业家王石演讲稿:坚持与放下
2014/04/27 职场文书
教师四风问题整改措施
2014/09/25 职场文书
学生偷窃检讨书
2014/09/25 职场文书
会计简历自我评价
2015/03/10 职场文书
社区安全温馨提示语
2015/07/14 职场文书
学校学习型党组织建设心得体会
2019/06/21 职场文书
Python如何识别银行卡卡号?
2021/06/10 Python
Go 语言下基于Redis分布式锁的实现方式
2021/06/28 Golang