python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单的通用表达式求10乘阶示例
Mar 03 Python
使用Python的PEAK来适配协议的教程
Apr 14 Python
Python环境下搭建属于自己的pip源的教程
May 05 Python
Python利用Beautiful Soup模块搜索内容详解
Mar 29 Python
python 将列表中的字符串连接成一个长路径的方法
Oct 23 Python
python处理multipart/form-data的请求方法
Dec 26 Python
Django使用AJAX调用自己写的API接口的方法
Mar 06 Python
Apache,wsgi,django 程序部署配置方法详解
Jul 01 Python
Python学习笔记之错误和异常及访问错误消息详解
Aug 08 Python
python编写实现抽奖器
Sep 10 Python
Python的logging模块基本用法
Dec 24 Python
Python Django项目和应用的创建详解
Nov 27 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
PHP版网站缓存加快打开速度的方法分享
2012/06/03 PHP
利用PHP+JS实现搜索自动提示(实例)
2013/06/09 PHP
PHP接收json 并将接收数据插入数据库的实现代码
2015/12/01 PHP
php与c 实现按行读取文件实例代码
2017/01/03 PHP
php多文件打包下载的实例代码
2017/07/12 PHP
PHP面向对象五大原则之接口隔离原则(ISP)详解
2018/04/04 PHP
thinkphp5.1框架模板赋值与变量输出示例
2020/05/25 PHP
php与阿里云短信接口接入操作案例分析
2020/05/27 PHP
jquery select操作的日期联动实现代码
2009/12/06 Javascript
关于jquery中全局函数each使用介绍
2013/12/10 Javascript
js获取光标位置和设置文本框光标位置示例代码
2014/01/09 Javascript
JS实现新浪微博效果带遮罩层的弹出框代码
2015/10/12 Javascript
IE8 内存泄露(内存一直增长 )的原因及解决办法
2016/04/06 Javascript
原生js封装二级城市下拉列表的实现代码
2016/06/16 Javascript
Javascript 跨域知识详细介绍
2016/10/30 Javascript
JS中事件冒泡和事件捕获介绍
2016/12/13 Javascript
bootstrap table 表格中增加下拉菜单末行出现滚动条的快速解决方法
2017/01/05 Javascript
详解nodejs中exports和module.exports的区别
2017/02/17 NodeJs
vue获取input输入值的问题解决办法
2017/10/17 Javascript
JS实现动态生成html table表格的方法分析
2018/07/11 Javascript
node.js中 redis 的安装和基本操作示例
2020/02/10 Javascript
用Python计算三角函数之atan()方法的使用
2015/05/15 Python
python安装与使用redis的方法
2016/04/19 Python
简单实现python聊天程序
2018/04/01 Python
python实现自动登录后台管理系统
2018/10/18 Python
对pandas读取中文unicode的csv和添加行标题的方法详解
2018/12/12 Python
python 反编译exe文件为py文件的实例代码
2019/06/27 Python
解决django接口无法通过ip进行访问的问题
2020/03/27 Python
Python根据字符串调用函数过程解析
2020/11/05 Python
matplotlib事件处理基础(事件绑定、事件属性)
2021/02/03 Python
浅谈html5与APP混合开发遇到的问题总结
2018/03/20 HTML / CSS
Public Desire美国/加拿大:全球性的在线鞋类品牌
2018/12/17 全球购物
优秀村官事迹材料
2014/01/10 职场文书
公司开业庆典策划方案
2014/06/04 职场文书
2014年小学语文工作总结
2014/12/20 职场文书
新生入学欢迎词
2015/01/26 职场文书