编程 Python

python中bs4.BeautifulSoup的基本用法

Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性，返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意，如果需要通过class去查找，则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签，p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性

import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签，是在原位置进行删除

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python中bs4.BeautifulSoup的基本用法

- Author -

bainianminguo

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

盘点提高 Python 代码效率的方法

Jul 03 Python

解读Python编程中的命名空间与作用域

Oct 16 Python

Python循环语句中else的用法总结

Sep 11 Python

python使用xpath中遇到：到底是什么？

Jan 04 Python

Python实现改变与矩形橡胶的线条的颜色代码示例

Jan 05 Python

Python 实现异步调用函数的示例讲解

Oct 14 Python

Python+OpenCV实现图像融合的原理及代码

Dec 03 Python

python使用selenium实现批量文件下载

Mar 11 Python

Django模型修改及数据迁移实现解析

Aug 01 Python

python数据类型之间怎么转换技巧分享

Aug 20 Python

解决Jupyter notebook更换主题工具栏被隐藏及添加目录生成插件问题

Apr 20 Python

分享几种python 变量合并方法

Mar 20 Python

Django的Modelforms用法简介

Jul 27 #Python

在django admin中添加自定义视图的例子

Jul 26 #Python

深入了解Django中间件及其方法

Jul 26 #Python

如何在Django项目中引入静态文件

Jul 26 #Python

Python 画出来六维图

Jul 26 #Python

django做form表单的数据验证过程详解

Jul 26 #Python

python用win32gui遍历窗口并设置窗口位置的方法

Jul 26 #Python