如何使用Python抓取网页tag操作


Posted in Python onFebruary 14, 2020

这篇文章主要介绍了如何使用Python抓取网页tag操作,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1. 获取操作tag

  • 获取操作tag的接种方式:
  • soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs),返回符合条件的所有标签,查找不到则返回[],可以传递标签名,标签属性,关键字参数,函数,True等
  • soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs),返回第一个符合条件的标签,查找不到则返回None
  • soup.select(selector, _candidate_generator=None, limit=None),根据css选择器返回所有符合条件的标签
  • soup.select_one(selector),返回符合css选择器的第一个标签

2. 操作tag

  • tag.name ,获取标签名,例如:'div'
  • tag['attr_name'] , 获取标签的某个属性的值,string类型
  • tag['class'] ,获取标签的class属性值,list类型,例如:['orange', 'login']
  • tag.attrs ,获取标签的所有属性,dict类型
  • tag.get_text() ,返回标签的内容,或者 tag.text

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3+PyQt5重新实现自定义数据拖放处理
Apr 19 Python
Python实现合并两个列表的方法分析
May 28 Python
Python求解任意闭区间的所有素数
Jun 10 Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 Python
Python语法分析之字符串格式化
Jun 13 Python
python多进程重复加载的解决方式
Dec 13 Python
NumPy统计函数的实现方法
Jan 21 Python
Python猴子补丁Monkey Patch用法实例解析
Mar 23 Python
Python基于Serializer实现字段验证及序列化
Nov 04 Python
python3访问字典里的值实例方法
Nov 18 Python
django上传文件的三种方式
Apr 29 Python
python自动计算图像数据集的RGB均值
Jun 18 Python
python使用python-pptx删除ppt某页实例
Feb 14 #Python
使用python-pptx包批量修改ppt格式的实现
Feb 14 #Python
python在不同条件下的输入与输出
Feb 13 #Python
深入浅析python的第三方库pandas
Feb 13 #Python
使用python的pyplot绘制函数实例
Feb 13 #Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
Feb 13 #Python
python输出pdf文档的实例
Feb 13 #Python
You might like
在PHP中运行Linux命令并启动SSH服务的例子
2014/06/12 PHP
PHP创建自己的Composer包方法
2018/04/09 PHP
thinkPHP5.1框架路由::get、post请求简单用法示例
2019/05/06 PHP
通过event对象的fromElement属性解决热区设置主实体的一个bug
2008/12/22 Javascript
使用insertAfter()方法在现有元素后添加一个新元素
2014/05/28 Javascript
jQuery中delegate()方法用法实例
2015/01/19 Javascript
Javascript常用小技巧汇总
2015/06/24 Javascript
javascript中eval和with用法实例总结
2015/11/30 Javascript
基于Jquery插件Uploadify实现实时显示进度条上传图片
2020/03/26 Javascript
深入浅析JavaScript中with语句的理解
2016/05/12 Javascript
移动端脚本框架Hammer.js
2016/12/15 Javascript
详解Weex基于Vue2.0开发模板搭建
2017/03/20 Javascript
nodejs个人博客开发第二步 入口文件
2017/04/12 NodeJs
详解JS数据类型的值拷贝函数(深拷贝)
2017/07/13 Javascript
layer iframe 设置关闭按钮的方法
2019/09/12 Javascript
Bootstrap table 实现树形表格联动选中联动取消功能
2019/09/30 Javascript
node+multer实现图片上传的示例代码
2020/02/18 Javascript
python使用Berkeley DB数据库实例
2014/09/26 Python
python使用wmi模块获取windows下硬盘信息的方法
2015/05/15 Python
浅谈python多线程和队列管理shell程序
2015/08/04 Python
numpy 计算两个数组重复程度的方法
2018/11/07 Python
python3.5 cv2 获取视频特定帧生成jpg图片
2019/08/28 Python
使用python实现画AR模型时序图
2019/11/20 Python
如何用python开发Zeroc Ice应用
2021/01/29 Python
python爬虫智能翻页批量下载文件的实例详解
2021/02/02 Python
京东港澳售:京东直邮港澳台
2018/01/31 全球购物
英国发展最快的在线超市之一:Click Marketplace
2021/02/15 全球购物
什么是跨站脚本攻击
2014/12/11 面试题
《小儿垂钓》教学反思
2014/02/23 职场文书
2014年最新大专生职业生涯规划书范文
2014/09/13 职场文书
对外汉语专业大学生职业生涯规划书
2014/10/11 职场文书
群众路线学习心得体会范文
2014/11/05 职场文书
生死抉择观后感
2015/06/09 职场文书
美德少年主要事迹材料
2015/11/04 职场文书
个人落户申请书怎么写?
2019/06/28 职场文书
超级实用的公文标题大全!
2019/07/19 职场文书