python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python xlwt设置excel单元格字体及格式
Apr 18 Python
Python pygorithm模块用法示例【常见算法测试】
Aug 16 Python
利用Pycharm断点调试Python程序的方法
Nov 29 Python
Python骚操作之动态定义函数
Mar 26 Python
python语言元素知识点详解
May 15 Python
Django配置MySQL数据库的完整步骤
Sep 07 Python
Python FTP文件定时自动下载实现过程解析
Nov 12 Python
python中栈的原理及实现方法示例
Nov 27 Python
pytorch使用tensorboardX进行loss可视化实例
Feb 24 Python
Python基础之列表常见操作经典实例详解
Feb 26 Python
pycharm软件实现设置自动保存操作
Jun 08 Python
python实现二分类和多分类的ROC曲线教程
Jun 15 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
使用Limit参数优化MySQL查询的方法
2008/11/12 PHP
完美解决PHP中文乱码
2009/11/26 PHP
php xml常用函数的集合(比较详细)
2013/06/06 PHP
ThinkPHP访问不存在的模块跳转到404页面的方法
2014/06/19 PHP
php结合js实现点击超链接执行删除确认操作
2014/10/31 PHP
php中使用session_set_save_handler()函数把session保存到MySQL数据库实例
2014/11/06 PHP
ThinkPHP中关联查询实例
2014/12/02 PHP
10个超级有用值得收藏的PHP代码片段
2015/01/22 PHP
通过PHP自带的服务器来查看正则匹配结果的方法
2015/12/24 PHP
PHP+Ajax简单get验证操作示例
2019/03/02 PHP
PHP7导出Excel报ERR_EMPTY_RESPONSE解决方法
2019/04/16 PHP
PHP+百度AI OCR文字识别实现了图片的文字识别功能
2019/05/08 PHP
JavaScript 序列化对象实现代码
2009/12/18 Javascript
全面兼容的javascript时间格式化函数(比较实用)
2014/05/14 Javascript
Dojo Javascript 编程规范 规范自己的JavaScript书写
2014/10/26 Javascript
TypeScript具有的几个不同特质
2015/04/07 Javascript
网页前端登录js按Enter回车键实现登陆的两种方法
2016/05/10 Javascript
vue下载excel的实现代码后台用post方法
2019/05/10 Javascript
JS拖动选择table里的单元格完整实例【基于jQuery】
2019/05/28 jQuery
JS中FormData类实现文件上传
2020/03/27 Javascript
[01:06]DOTA2亚洲邀请赛专属珍藏-荧煌之礼
2017/03/24 DOTA
python基础教程之匿名函数lambda
2017/01/17 Python
python如何读写csv数据
2018/03/21 Python
python去除文件中重复的行实例
2018/06/29 Python
详解Python_shutil模块
2019/03/15 Python
python字符串判断密码强弱
2020/03/18 Python
python TCP包注入方式
2020/05/05 Python
Python爬虫requests库多种用法实例
2020/05/28 Python
keras CNN卷积核可视化,热度图教程
2020/06/22 Python
AmazeUI 等分网格的实现示例
2020/08/25 HTML / CSS
网络安全类面试题
2015/08/01 面试题
工程现场管理求职自荐信
2013/10/02 职场文书
教师试用期自我鉴定
2014/02/12 职场文书
医疗专业毕业生求职信
2014/08/28 职场文书
民政局办理协议离婚(范本)
2014/10/25 职场文书
西安兵马俑导游词
2015/02/02 职场文书