python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中关于中文编码问题的处理建议
Apr 08 Python
Python字符串中查找子串小技巧
Apr 10 Python
Python中random模块生成随机数详解
Mar 10 Python
简单了解什么是神经网络
Dec 23 Python
python实现将excel文件转化成CSV格式
Mar 22 Python
python读取和保存视频文件
Apr 16 Python
Atom的python插件和常用插件说明
Jul 08 Python
python添加模块搜索路径和包的导入方法
Jan 19 Python
Python3监控windows,linux系统的CPU、硬盘、内存使用率和各个端口的开启情况详细代码实例
Mar 18 Python
python 实现单例模式的5种方法
Sep 23 Python
浅谈Python基础之列表那些事儿
May 11 Python
使用opencv-python如何打开USB或者笔记本前置摄像头
Jun 21 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
PHP中创建空文件的代码[file_put_contents vs touch]
2012/01/20 PHP
php数字每三位加逗号的功能函数
2015/10/22 PHP
php设计模式之模板模式实例分析【星际争霸游戏案例】
2020/03/24 PHP
JavaScript更改原始对象valueOf的方法
2015/03/19 Javascript
js获得当前系统日期时间的方法
2015/05/06 Javascript
AngularJS基础 ng-csp 指令详解
2016/08/01 Javascript
深入理解jQuery.data() 的实现方式
2016/11/30 Javascript
微信小程序 radio单选框组件详解及实例代码
2017/01/10 Javascript
vue双向数据绑定原理探究(附demo)
2017/01/17 Javascript
JavaScript 事件对内存和性能的影响
2017/01/22 Javascript
JavaScript在form表单中使用button按钮实现submit提交方法
2017/01/23 Javascript
JavaScript实现图片懒加载的方法分析
2018/07/05 Javascript
vue自定义指令的创建和使用方法实例分析
2018/12/04 Javascript
微信小程序实现上传word、txt、Excel、PPT等文件功能
2019/05/23 Javascript
LayUi数据表格自定义赋值方式
2019/10/26 Javascript
nuxt 自定义 auth 中间件实现令牌的持久化操作
2020/11/05 Javascript
基于JavaScript实现简单扫雷游戏
2021/01/02 Javascript
python实现rest请求api示例
2014/04/22 Python
讲解Python中if语句的嵌套用法
2015/05/14 Python
Tensorflow 同时载入多个模型的实例讲解
2018/07/27 Python
python将一组数分成每3个一组的实例
2018/11/14 Python
使用python将excel数据导入数据库过程详解
2019/08/27 Python
python实现大学人员管理系统
2019/10/25 Python
keras中的History对象用法
2020/06/19 Python
解决Pycharm 中遇到Unresolved reference 'sklearn'的问题
2020/07/13 Python
Python基于xlrd模块处理合并单元格
2020/07/28 Python
python字典与json转换的方法总结
2020/12/28 Python
新奇的小玩意:IWOOT
2016/07/21 全球购物
经销商订货会主持词
2014/03/27 职场文书
个人借款担保书
2014/04/02 职场文书
服务标语口号
2014/07/01 职场文书
小学安全工作汇报材料
2014/08/19 职场文书
出差报告格式模板
2014/11/06 职场文书
中标通知书格式
2015/04/17 职场文书
Java Spring 控制反转(IOC)容器详解
2021/10/05 Java/Android
画错魏国疆域啦!《派对咖孔明》动画因作画失误于官网致歉
2022/04/07 日漫