python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
盘点提高 Python 代码效率的方法
Jul 03 Python
解读Python编程中的命名空间与作用域
Oct 16 Python
Python循环语句中else的用法总结
Sep 11 Python
python使用xpath中遇到:到底是什么?
Jan 04 Python
Python实现改变与矩形橡胶的线条的颜色代码示例
Jan 05 Python
Python 实现异步调用函数的示例讲解
Oct 14 Python
Python+OpenCV实现图像融合的原理及代码
Dec 03 Python
python使用selenium实现批量文件下载
Mar 11 Python
Django模型修改及数据迁移实现解析
Aug 01 Python
python数据类型之间怎么转换技巧分享
Aug 20 Python
解决Jupyter notebook更换主题工具栏被隐藏及添加目录生成插件问题
Apr 20 Python
分享几种python 变量合并方法
Mar 20 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
php smarty函数扩展
2010/03/15 PHP
PHP+ACCESS 文章管理程序代码
2010/06/21 PHP
利用PHPExcel实现Excel文件的写入和读取
2017/04/26 PHP
php显示页码分页类的封装
2017/06/08 PHP
php+ajax 文件上传代码实例
2019/03/18 PHP
php+layui数据表格实现数据分页渲染代码
2019/10/26 PHP
JavaScript入门教程(2) JS基础知识
2009/01/31 Javascript
js遍历、动态的添加数据的小例子
2013/06/22 Javascript
javascript列表框操作函数集合汇总
2013/11/28 Javascript
js获取html页面节点方法(递归方式)
2013/12/13 Javascript
JavaScript DOM事件(笔记)
2015/04/08 Javascript
jQuery检测输入的字符串包含的中英文的数量
2015/04/17 Javascript
实例代码讲解jquery easyui动态tab页
2015/11/17 Javascript
JavaScript高级教程5.6之基本包装类型(详细)
2015/11/23 Javascript
基于JS实现横线提示输入验证码随验证码输入消失(js验证码的实现)
2016/10/27 Javascript
微信小程序 简单教程实例详解
2017/01/13 Javascript
JS原型与原型链的深入理解
2017/02/15 Javascript
JS实现基于拖拽改变物体大小的方法
2018/01/23 Javascript
vue组件表单数据回显验证及提交的实例代码
2018/08/30 Javascript
uni-app如何实现增量更新功能
2020/01/03 Javascript
JS+canvas五子棋人机对战实现步骤详解
2020/06/04 Javascript
python中map、any、all函数用法分析
2015/04/21 Python
Python中的time模块与datetime模块用法总结
2016/06/30 Python
浅析Python中return和finally共同挖的坑
2017/08/18 Python
基于Python __dict__与dir()的区别详解
2017/10/30 Python
利用Python如何制作好玩的GIF动图详解
2018/07/11 Python
对python 匹配字符串开头和结尾的方法详解
2018/10/27 Python
Python实现获取系统临时目录及临时文件的方法示例
2019/06/26 Python
PyTorch的深度学习入门之PyTorch安装和配置
2019/06/27 Python
python射线法判断检测点是否位于区域外接矩形内
2019/06/28 Python
Python 分享10个PyCharm技巧
2019/07/13 Python
TensorFlow绘制loss/accuracy曲线的实例
2020/01/21 Python
python Timer 类使用介绍
2020/12/28 Python
小学生迎国庆演讲稿
2014/09/05 职场文书
商务考察邀请函模板
2015/02/02 职场文书
老公婚前保证书
2015/02/28 职场文书