python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中统计函数运行耗时的方法
May 05 Python
windows系统下Python环境搭建教程
Mar 28 Python
分享一下如何编写高效且优雅的 Python 代码
Sep 07 Python
Queue 实现生产者消费者模型(实例讲解)
Nov 13 Python
Python使用re模块实现信息筛选的方法
Apr 29 Python
python使用Flask操作mysql实现登录功能
May 14 Python
python用类实现文章敏感词的过滤方法示例
Oct 27 Python
pytorch查看torch.Tensor和model是否在CUDA上的实例
Jan 03 Python
使用keras和tensorflow保存为可部署的pb格式
May 25 Python
详解利用python识别图片中的条码(pyzbar)及条码图片矫正和增强
Nov 17 Python
Python xlwings插入Excel图片的实现方法
Feb 26 Python
基于Python实现流星雨效果的绘制
Mar 18 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
PHP输出当前进程所有变量/常量/模块/函数/类的示例
2013/11/07 PHP
PHP实现带进度条的Ajax文件上传功能示例
2019/07/02 PHP
JavaScript与函数式编程解释
2007/04/27 Javascript
JavaScript学习笔记(十七)js 优化
2010/02/04 Javascript
基于jquery的让页面控件不可用的实现代码
2010/04/27 Javascript
Document对象内容集合(比较全)
2010/09/06 Javascript
document.write的几点使用心得
2014/05/14 Javascript
JavaScript实现简单的数字倒计时
2015/05/15 Javascript
使用jQuery Mobile框架开发移动端Web App的入门教程
2016/05/17 Javascript
静态页面html中跳转传值的JS处理技巧
2016/06/22 Javascript
全面解析JavaScript中“&&”和“||”操作符(总结篇)
2016/07/18 Javascript
Vue.js父与子组件之间传参示例
2017/02/28 Javascript
jquery tmpl模板(实例讲解)
2017/09/02 jQuery
express+mockjs实现模拟后台数据发送功能
2018/01/07 Javascript
js canvas实现二维码和图片合成的海报
2020/11/19 Javascript
Vue CLI3基础学习之pages构建多页应用
2019/06/02 Javascript
NodeJS有难度的面试题(能答对几个)
2019/10/09 NodeJs
vue使用svg文件补充-svg放大缩小操作(使用d3.js)
2020/09/22 Javascript
原生js实现自定义难度的扫雷游戏
2021/01/22 Javascript
在Python中操作文件之seek()方法的使用教程
2015/05/24 Python
详解Python多线程Selenium跨浏览器测试
2017/04/01 Python
python读写json文件的简单实现
2017/04/11 Python
Python图像处理之简单画板实现方法示例
2018/08/30 Python
Python二叉树的遍历操作示例【前序遍历,中序遍历,后序遍历,层序遍历】
2018/12/24 Python
python列表,字典,元组简单用法示例
2019/07/11 Python
Linux下升级安装python3.8并配置pip及yum的教程
2020/01/02 Python
python 爬取马蜂窝景点翻页文字评论的实现
2020/01/20 Python
python3处理word文档实例分析
2020/12/01 Python
CSS3 实现穿梭星空动画
2020/11/13 HTML / CSS
HTML5离线缓存在tomcat下部署可实现图片flash等离线浏览
2012/12/13 HTML / CSS
摩托车和ATV零件、配件和服装的首选在线零售商:MotoSport
2017/12/22 全球购物
婴儿鞋,独特的婴儿服装和配件:Zutano
2018/11/03 全球购物
二年级语文教学反思
2014/02/02 职场文书
2016国庆节67周年寄语
2015/12/07 职场文书
导游词之潮音寺
2019/09/26 职场文书
mysql备份策略的实现(全量备份+增量备份)
2021/07/07 MySQL