python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用logging结合decorator模式实现优化日志输出的方法
Apr 16 Python
python executemany的使用及注意事项
Mar 13 Python
python将ansible配置转为json格式实例代码
May 15 Python
Python使用剪切板的方法
Jun 06 Python
Python中Selenium模拟JQuery滑动解锁实例
Jul 26 Python
一个月入门Python爬虫学习,轻松爬取大规模数据
Jan 03 Python
使用Python从零开始撸一个区块链
Mar 14 Python
PYTHON如何读取和写入EXCEL里面的数据
Oct 28 Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 Python
python中round函数如何使用
Jun 19 Python
python 基于opencv去除图片阴影
Jan 26 Python
python中filter,map,reduce的作用
Jun 10 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
PHP如何得到当前页和上一页的地址?
2006/11/27 PHP
让PHP COOKIE立即生效,不用刷新就可以使用
2011/03/09 PHP
探讨php中遍历二维数组的几种方法详解
2013/06/08 PHP
php多维数组去掉重复值示例分享
2014/03/02 PHP
PHP图片等比缩放类SimpleImage使用方法和使用实例分享
2014/04/10 PHP
php轻松实现文件上传功能
2016/03/03 PHP
PHP函数checkdnsrr用法详解(Windows平台用法)
2016/03/21 PHP
js word表格动态添加代码
2010/06/07 Javascript
说说JSON和JSONP 也许你会豁然开朗
2012/09/02 Javascript
Javascript模块化编程(三)require.js的用法及功能介绍
2013/01/17 Javascript
js+jquery实现图片裁剪功能
2015/01/02 Javascript
AngularJS模块管理问题的非常规处理方法
2015/04/29 Javascript
jQuery实现淡入淡出二级下拉导航菜单的方法
2015/08/28 Javascript
基于BootStrap Metronic开发框架经验小结【三】下拉列表Select2插件的使用
2016/05/12 Javascript
Node.JS中快速扫描端口并发现局域网内的Web服务器地址(80)
2017/09/18 Javascript
jQuery zTree搜索-关键字查询 递归无限层功能实现代码
2018/01/25 jQuery
浅谈Fetch 数据交互方式
2018/12/20 Javascript
js实现网页同时进行多个倒计时功能
2019/02/25 Javascript
node.js 微信开发之定时获取access_token
2020/02/07 Javascript
JS常见内存泄漏及解决方案解析
2020/05/30 Javascript
使用原生javascript开发计算器实例代码
2021/02/21 Javascript
[39:21]LGD vs OG 2019国际邀请赛淘汰赛 胜者组 BO3 第二场 8.24
2019/09/10 DOTA
python递归查询菜单并转换成json实例
2017/03/27 Python
在python中获取div的文本内容并和想定结果进行对比详解
2019/01/02 Python
Python调用钉钉自定义机器人的实现
2020/01/03 Python
python连接mongodb集群方法详解
2020/02/13 Python
python定义类的简单用法
2020/07/24 Python
美国第一大药店连锁机构:Walgreens(沃尔格林)
2019/10/10 全球购物
医药大学生求职简历的自我评价
2013/10/17 职场文书
大学自我鉴定
2013/12/20 职场文书
社区春季防火方案
2014/06/02 职场文书
2014年党的群众路线教育实践活动整改措施(个人版)
2014/09/25 职场文书
保洁员岗位职责
2015/02/04 职场文书
五四青年节活动总结
2015/02/10 职场文书
2015年档案管理工作总结
2015/04/08 职场文书
图书馆义工感想
2015/08/07 职场文书