python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python登录豆瓣并发帖的方法
Jul 08 Python
Python编程实现二分法和牛顿迭代法求平方根代码
Dec 04 Python
Python2.X/Python3.X中urllib库区别讲解
Dec 19 Python
Flask框架通过Flask_login实现用户登录功能示例
Jul 17 Python
详解如何为eclipse安装合适版本的python插件pydev
Nov 04 Python
Appium+Python自动化测试之运行App程序示例
Jan 23 Python
Python socket实现多对多全双工通信的方法
Feb 13 Python
Python3.5常见内置方法参数用法实例详解
Apr 29 Python
Opencv实现抠图背景图替换功能
May 21 Python
使用pycharm在本地开发并实时同步到服务器
Aug 02 Python
python 实现将小图片放到另一个较大的白色或黑色背景图片中
Dec 12 Python
tensorflow使用freeze_graph.py将ckpt转为pb文件的方法
Apr 22 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
cmd下运行php脚本
2008/11/25 PHP
解决php表单重复提交实现方法
2015/09/29 PHP
php7基于递归实现删除空文件夹的方法示例
2017/06/15 PHP
php无限级分类实现评论及回复功能
2019/02/18 PHP
PHP实现获取毫秒时间戳的方法【使用microtime()函数】
2019/03/01 PHP
浅析PHP7 的垃圾回收机制
2019/09/06 PHP
PHP常用函数之根据生日计算年龄功能示例
2019/10/21 PHP
PHP如何通过date() 函数格式化显示时间
2020/11/13 PHP
xmlHTTP实例
2006/10/24 Javascript
JS实现固定在右下角可展开收缩DIV层的方法
2015/02/13 Javascript
JQuery中节点遍历方法实例
2015/05/18 Javascript
jQuery+css实现的切换图片功能代码
2016/01/27 Javascript
JavaScript自动点击链接 防止绕过浏览器访问的方法
2017/01/19 Javascript
JavaScript中数组Array.sort()排序方法详解
2017/03/01 Javascript
AngularJS实现的生成随机数与猜数字大小功能示例
2017/12/25 Javascript
JS中原始值和引用值的储存方式示例详解
2018/03/23 Javascript
在vue2.0中引用element-ui组件库的方法
2018/06/21 Javascript
详解Axios 如何取消已发送的请求
2018/10/20 Javascript
通过cordova将vue项目打包为webapp的方法
2019/02/02 Javascript
Vue-drag-resize 拖拽缩放插件的使用(简单示例)
2019/12/04 Javascript
vue-model实现简易计算器
2020/08/17 Javascript
Python正则表达式匹配ip地址实例
2014/10/09 Python
python如何在列表、字典中筛选数据
2018/03/19 Python
解决Python plt.savefig 保存图片时一片空白的问题
2019/01/10 Python
使用turtle绘制五角星、分形树
2019/10/06 Python
Python元组 tuple的概念与基本操作详解【定义、创建、访问、计数、推导式等】
2019/10/30 Python
Tensorflow之梯度裁剪的实现示例
2020/03/08 Python
python继承threading.Thread实现有返回值的子类实例
2020/05/02 Python
一款纯css3制作的2015年元旦雪人动画特效教程
2014/12/29 HTML / CSS
BIBLOO波兰:捷克的一家在线服装店
2018/03/09 全球购物
房地产推广策划方案
2014/05/19 职场文书
化工见习报告范文
2014/10/31 职场文书
2014年导购员工作总结
2014/11/18 职场文书
一封真诚的自荐信帮你赢得机会
2019/05/07 职场文书
银行求职信范文
2019/05/13 职场文书
golang gopm get -g -v 无法获取第三方库的解决方案
2021/05/05 Golang