python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例


Posted in Python onNovember 28, 2019

本文实例讲述了python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据。分享给大家供大家参考,具体如下:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()
html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文档对象
#查找a标签,只会查找出一个a标签
#print(soup.a)#<a class="sister" href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" id="xiaodeng"><!-- Elsie --></a>
for k in soup.find_all('a'):
 print(k)
 print(k['class'])#查a标签的class属性
 print(k['id'])#查a标签的id值
 print(k['href'])#查a标签的href值
 print(k.string)#查a标签的string
#如果,标签中含有其他标签,比如..,此时要提取中的数据,需要用k.get_text()
#tag.get('calss'),也可以达到这个效果

Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

更多关于Python相关内容可查看本站专题:《

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python查询IP地址归属完整代码
Jun 21 Python
django项目运行因中文而乱码报错的几种情况解决
Nov 07 Python
Python爬虫实现百度图片自动下载
Feb 04 Python
python入门教程 python入门神图一张
Mar 05 Python
Python批处理删除和重命名文件夹的实例
Jul 11 Python
python调用动态链接库的基本过程详解
Jun 19 Python
python读取word 中指定位置的表格及表格数据
Oct 23 Python
Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解))
Dec 09 Python
Python unittest框架操作实例解析
Apr 13 Python
用Python爬取LOL所有的英雄信息以及英雄皮肤的示例代码
Jul 13 Python
pymysql模块使用简介与示例
Nov 17 Python
DRF使用simple JWT身份验证的实现
Jan 14 Python
解决Python二维数组赋值问题
Nov 28 #Python
python之array赋值技巧分享
Nov 28 #Python
python3 实现函数写文件路径的正确方法
Nov 27 #Python
关于Python3 lambda函数的深入浅出
Nov 27 #Python
python3中rank函数的用法
Nov 27 #Python
Python values()与itervalues()的用法详解
Nov 27 #Python
python3 assert 断言的使用详解 (区别于python2)
Nov 27 #Python
You might like
php使用post数组的键值创建同名变量并赋值的方法
2015/04/03 PHP
php查找字符串中第一个非0的位置截取
2017/02/27 PHP
php实现和c#一致的DES加密解密实例
2017/07/24 PHP
innerHTML,outerHTML,innerTEXT三者之间的区别
2007/01/28 Javascript
js操作select控件的几种方法
2010/06/02 Javascript
基于jquery循环map功能的代码
2011/02/26 Javascript
移动节点的jquery代码
2014/01/13 Javascript
javascript实现tab响应式切换特效
2016/01/29 Javascript
鼠标拖动改变DIV等网页元素的大小的实现方法
2017/07/06 Javascript
在iframe中使bootstrap的模态框在父页面弹出问题
2017/08/07 Javascript
vue数字类型过滤器的示例代码
2017/09/07 Javascript
js使用ajax传值给后台,后台返回字符串处理方法
2018/08/08 Javascript
Koa代理Http请求的示例代码
2018/10/10 Javascript
Layui数据表格跳转到指定页的实现方法
2019/09/05 Javascript
jQuery实现获取多选框的值示例
2020/02/07 jQuery
[01:02]DOTA2辉夜杯决赛日 CDEC.Y对阵VG赛前花絮
2015/12/27 DOTA
[56:58]VP vs Optic 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
Python中struct模块对字节流/二进制流的操作教程
2017/01/21 Python
详解Python里使用正则表达式的ASCII模式
2017/11/02 Python
对python多线程SSH登录并发脚本详解
2019/02/14 Python
深入了解和应用Python 装饰器 @decorator
2019/04/02 Python
Python3实现汉语转换为汉语拼音
2019/07/08 Python
用Pytorch训练CNN(数据集MNIST,使用GPU的方法)
2019/08/19 Python
用python画一只可爱的皮卡丘实例
2019/11/21 Python
python文件绝对路径写法介绍(windows)
2019/12/25 Python
python怎么自定义捕获错误
2020/06/29 Python
python raise的基本使用
2020/09/10 Python
HTML5安全介绍之内容安全策略(CSP)简介
2012/07/10 HTML / CSS
HTML5 history新特性pushState、replaceState及两者的区别
2015/12/26 HTML / CSS
无谷物狗粮:Pooch & Mutt
2018/05/23 全球购物
农村婚礼主持词
2014/03/13 职场文书
医院党员公开承诺书
2014/08/30 职场文书
2014老师三严三实对照检查材料思想汇报
2014/09/18 职场文书
领导班子作风建设剖析材料
2014/10/11 职场文书
2015年社会治安综合治理工作总结
2015/04/10 职场文书
如何在Mac上通过docker配置PHP开发环境
2021/05/29 PHP