如何使用Python抓取网页tag操作


Posted in Python onFebruary 14, 2020

这篇文章主要介绍了如何使用Python抓取网页tag操作,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1. 获取操作tag

  • 获取操作tag的接种方式:
  • soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs),返回符合条件的所有标签,查找不到则返回[],可以传递标签名,标签属性,关键字参数,函数,True等
  • soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs),返回第一个符合条件的标签,查找不到则返回None
  • soup.select(selector, _candidate_generator=None, limit=None),根据css选择器返回所有符合条件的标签
  • soup.select_one(selector),返回符合css选择器的第一个标签

2. 操作tag

  • tag.name ,获取标签名,例如:'div'
  • tag['attr_name'] , 获取标签的某个属性的值,string类型
  • tag['class'] ,获取标签的class属性值,list类型,例如:['orange', 'login']
  • tag.attrs ,获取标签的所有属性,dict类型
  • tag.get_text() ,返回标签的内容,或者 tag.text

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现发送邮件及附件功能
Mar 02 Python
python单例模式获取IP代理的方法详解
Sep 13 Python
python使用knn实现特征向量分类
Dec 26 Python
Python使用Pandas库实现MySQL数据库的读写
Jul 06 Python
使用Django搭建web服务器的例子(最最正确的方式)
Aug 29 Python
python GUI库图形界面开发之PyQt5表单布局控件QFormLayout详细使用方法与实例
Mar 06 Python
python opencv 检测移动物体并截图保存实例
Mar 10 Python
Django基于客户端下载文件实现方法
Apr 21 Python
Python安装并操作redis实现流程详解
Oct 13 Python
pytorch 中nn.Dropout的使用说明
May 20 Python
写一个Python脚本下载哔哩哔哩舞蹈区的所有视频
May 31 Python
利用Python将list列表写入文件并读取的方法汇总
Mar 25 Python
python使用python-pptx删除ppt某页实例
Feb 14 #Python
使用python-pptx包批量修改ppt格式的实现
Feb 14 #Python
python在不同条件下的输入与输出
Feb 13 #Python
深入浅析python的第三方库pandas
Feb 13 #Python
使用python的pyplot绘制函数实例
Feb 13 #Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
Feb 13 #Python
python输出pdf文档的实例
Feb 13 #Python
You might like
仿AS3实现PHP 事件机制实现代码
2011/01/27 PHP
PHP 数据结构 算法描述 冒泡排序 bubble sort
2011/07/10 PHP
php生成图片缩略图功能示例
2017/02/22 PHP
PHP抽象类基本用法示例
2018/12/28 PHP
jQuery 位置函数offset,innerWidth,innerHeight,outerWidth,outerHeight,scrollTop,scrollLeft
2010/03/23 Javascript
js预载入和JavaScript Image()对象使用介绍
2011/08/28 Javascript
jquery select动态加载选择(兼容各种浏览器)
2013/02/01 Javascript
jQuery学习笔记之jQuery动画效果
2013/09/09 Javascript
JavaScript按位运算符的应用简析
2014/02/04 Javascript
JS判断页面是否出现滚动条的方法
2015/07/17 Javascript
深入理解AngularJS中的ng-bind-html指令和$sce服务
2016/09/08 Javascript
Vue.js组件tree实现无限级树形菜单
2016/12/02 Javascript
jQuery Ajax实现Select多级关联动态绑定数据的实例代码
2018/10/26 jQuery
JavaScript 点击触发复制功能实例详解
2018/11/02 Javascript
Angular设置别名alias的方法
2018/11/08 Javascript
微信小程序实现发送验证码按钮效果
2018/12/20 Javascript
vue如何获取自定义元素属性参数值的方法
2019/05/14 Javascript
js尾调用优化的实现
2019/05/23 Javascript
layui实现三级导航菜单
2019/07/26 Javascript
JS轮播图的实现方法
2020/08/24 Javascript
html中创建并调用vue组件的几种方法汇总
2020/11/17 Javascript
python实现多线程的两种方式
2016/05/22 Python
Python脚本处理空格的方法
2016/08/08 Python
python3中set(集合)的语法总结分享
2017/03/24 Python
Python实现的当前时间多加一天、一小时、一分钟操作示例
2018/05/21 Python
Python多进程方式抓取基金网站内容的方法分析
2019/06/03 Python
PyInstaller将Python文件打包为exe后如何反编译(破解源码)以及防止反编译
2020/04/15 Python
详解canvas多边形(蜘蛛图)的画法示例
2018/01/29 HTML / CSS
JYSK加拿大:购买家具、床垫、家居装饰等
2020/02/14 全球购物
路由表示做什么用的?在linux环境中怎么来配置一条默认路由?
2013/06/07 面试题
不同浏览器创建XMLHttpRequest方法有什么不同
2014/11/17 面试题
捐书寄语赠言
2014/01/18 职场文书
乡镇平安建设汇报材料
2014/08/25 职场文书
干部职工纪律作风整改措施思想汇报
2014/10/11 职场文书
解除合同协议书范本
2016/03/21 职场文书
世界无敌的ICOM IC-R9500宽频接收机
2022/03/25 无线电