python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python设置windows桌面壁纸的实现代码
Jan 28 Python
python中的一些类型转换函数小结
Feb 10 Python
浅谈配置OpenCV3 + Python3的简易方法(macOS)
Apr 02 Python
Python骚操作之动态定义函数
Mar 26 Python
Python增强赋值和共享引用注意事项小结
May 28 Python
django实现用户注册实例讲解
Oct 30 Python
python爬虫开发之使用Python爬虫库requests多线程抓取猫眼电影TOP100实例
Mar 10 Python
如何对python的字典进行排序
Jun 19 Python
浅谈django框架集成swagger以及自定义参数问题
Jul 07 Python
pandas 实现将NaN转换为None
May 14 Python
Django实现翻页的示例代码
May 24 Python
教你用python实现12306余票查询
Jun 30 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
4月1日重磅发布!《星际争霸II》6.0.0版本更新
2020/04/09 星际争霸
PHP版国家代码、缩写查询函数代码
2011/08/14 PHP
preg_match_all使用心得分享
2014/01/31 PHP
php数组中包含中文的排序方法
2014/06/03 PHP
PHP中使用匿名函数操作数据库的例子
2014/11/17 PHP
php实现购物车功能(以大苹果购物网为例)
2017/03/09 PHP
浅析PHP数据导出知识点
2018/02/17 PHP
thinkphp5框架扩展redis类方法示例
2019/05/06 PHP
javascript 数据类型转换(parseInt,parseFloat)
2010/07/20 Javascript
event.currentTarget与event.target的区别介绍
2012/12/31 Javascript
解析Javascript小括号“()”的多义性
2013/12/03 Javascript
JavaScript面向对象程序设计教程
2016/03/29 Javascript
jQuery中的Deferred和promise 的区别
2016/04/03 Javascript
JS简单编号生成器实现方法(附demo源码下载)
2016/04/05 Javascript
JavaScript仿网易选项卡制作代码
2016/10/06 Javascript
学习vue.js中class与style绑定
2016/12/03 Javascript
Angular ng-repeat指令实例以及扩展部分
2016/12/26 Javascript
简单的jQuery拖拽排序效果的实现(增强动态)
2017/02/09 Javascript
input type=file 选择图片并且实现预览效果的实例
2017/10/26 Javascript
H5实现手机拍照和选择上传功能
2019/12/18 Javascript
使用 Jest 和 Supertest 进行接口端点测试实例详解
2020/04/25 Javascript
用vue 实现手机触屏滑动功能
2020/05/28 Javascript
[03:48]DOTA2完美大师赛主赛事第二日精彩集锦
2017/11/24 DOTA
Python2和Python3中print的用法示例总结
2017/10/25 Python
Windows下Anaconda的安装和简单使用方法
2018/01/04 Python
unittest+coverage单元测试代码覆盖操作实例详解
2018/04/04 Python
对Python中list的倒序索引和切片实例讲解
2018/11/15 Python
python按修改时间顺序排列文件的实例代码
2019/07/25 Python
关于TensorFlow新旧版本函数接口变化详解
2020/02/10 Python
国际书籍零售商:Wordery
2017/11/01 全球购物
官方授权图形T恤和服装:Fifth Sun
2019/06/12 全球购物
我未来的职业规划范文
2014/01/11 职场文书
2015年公司中秋节致辞
2015/07/31 职场文书
纪检部部长竞选稿
2015/11/21 职场文书
CSS几步实现赛博朋克2077风格视觉效果
2021/06/16 HTML / CSS
SpringBoot+Vue+JWT的前后端分离登录认证详细步骤
2021/09/25 Java/Android