如何使用Python抓取网页tag操作


Posted in Python onFebruary 14, 2020

这篇文章主要介绍了如何使用Python抓取网页tag操作,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1. 获取操作tag

  • 获取操作tag的接种方式:
  • soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs),返回符合条件的所有标签,查找不到则返回[],可以传递标签名,标签属性,关键字参数,函数,True等
  • soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs),返回第一个符合条件的标签,查找不到则返回None
  • soup.select(selector, _candidate_generator=None, limit=None),根据css选择器返回所有符合条件的标签
  • soup.select_one(selector),返回符合css选择器的第一个标签

2. 操作tag

  • tag.name ,获取标签名,例如:'div'
  • tag['attr_name'] , 获取标签的某个属性的值,string类型
  • tag['class'] ,获取标签的class属性值,list类型,例如:['orange', 'login']
  • tag.attrs ,获取标签的所有属性,dict类型
  • tag.get_text() ,返回标签的内容,或者 tag.text

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的异常处理相关语句基础学习笔记
Jul 11 Python
详解python中 os._exit() 和 sys.exit(), exit(0)和exit(1) 的用法和区别
Jun 23 Python
全面了解Nginx, WSGI, Flask之间的关系
Jan 09 Python
Python面向对象编程之继承与多态详解
Jan 16 Python
对python指数、幂数拟合curve_fit详解
Dec 29 Python
解决Python计算矩阵乘向量,矩阵乘实数的一些小错误
Aug 26 Python
使用python实现离散时间傅里叶变换的方法
Sep 02 Python
Python Pandas 转换unix时间戳方式
Dec 07 Python
Python 限定函数参数的类型及默认值方式
Dec 24 Python
Python并发爬虫常用实现方法解析
Nov 19 Python
Python中生成ndarray实例讲解
Feb 22 Python
Python  Asyncio模块实现的生产消费者模型的方法
Mar 01 Python
python使用python-pptx删除ppt某页实例
Feb 14 #Python
使用python-pptx包批量修改ppt格式的实现
Feb 14 #Python
python在不同条件下的输入与输出
Feb 13 #Python
深入浅析python的第三方库pandas
Feb 13 #Python
使用python的pyplot绘制函数实例
Feb 13 #Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
Feb 13 #Python
python输出pdf文档的实例
Feb 13 #Python
You might like
给初学PHP的5个入手程序
2006/11/23 PHP
php显示指定目录下子目录的方法
2015/03/20 PHP
程序员的表白神器“520”大声喊出来
2016/05/20 PHP
PHP设计模式之装饰器模式实例详解
2018/02/07 PHP
Yii框架的路由配置方法分析
2019/09/09 PHP
js 判断脚本加载完毕的代码
2011/07/13 Javascript
JS将秒换成时分秒实现代码
2013/09/03 Javascript
jQuery中bind与live的用法及区别小结
2014/01/27 Javascript
Jquery实现Div上下移动示例
2014/04/23 Javascript
jQuery设置和获取HTML、文本和值示例
2014/07/08 Javascript
Jquery左右滑动插件之实现超级炫酷动画效果附源码下载
2015/12/02 Javascript
用Vue-cli搭建的项目中引入css报错的原因分析
2017/07/20 Javascript
使用vue-aplayer插件时出现的问题的解决
2018/03/02 Javascript
在Vue项目中使用Typescript的实现
2019/12/19 Javascript
vue 接口请求地址前缀本地开发和线上开发设置方式
2020/08/13 Javascript
Python新手在作用域方面经常容易碰到的问题
2015/04/03 Python
Python selenium 父子、兄弟、相邻节点定位方式详解
2016/09/15 Python
Python字符编码转码之GBK,UTF8互转
2020/02/09 Python
Python利用逻辑回归分类实现模板
2020/02/15 Python
总结Pyinstaller的坑及终极解决方法(小结)
2020/09/21 Python
python3代码输出嵌套式对象实例详解
2020/12/03 Python
收集的7个CSS3代码生成工具
2010/04/17 HTML / CSS
智能电子应届生求职信
2013/11/10 职场文书
经济管理毕业生求职信
2014/03/15 职场文书
煤矿安全协议书
2014/08/20 职场文书
初级党校心得体会
2014/09/11 职场文书
党员三严三实对照检查材料
2014/10/13 职场文书
房屋买卖委托书格式范本格式
2014/10/13 职场文书
政风行风评议心得体会
2014/10/21 职场文书
班主任寄语2015
2015/02/26 职场文书
小兵张嘎电影观后感
2015/06/03 职场文书
2015秋季运动会通讯稿
2015/07/18 职场文书
开学第一天的感想
2015/08/10 职场文书
Python使用protobuf序列化和反序列化的实现
2021/05/19 Python
CSS3实现指纹特效代码
2022/03/17 HTML / CSS
20180830晚上第一届KSL半决赛 雨神vs解冻(二龙 三炮解说)
2022/04/01 星际争霸