python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例


Posted in Python onNovember 28, 2019

本文实例讲述了python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据。分享给大家供大家参考,具体如下:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()
html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文档对象
#查找a标签,只会查找出一个a标签
#print(soup.a)#<a class="sister" href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" id="xiaodeng"><!-- Elsie --></a>
for k in soup.find_all('a'):
 print(k)
 print(k['class'])#查a标签的class属性
 print(k['id'])#查a标签的id值
 print(k['href'])#查a标签的href值
 print(k.string)#查a标签的string
#如果,标签中含有其他标签,比如..,此时要提取中的数据,需要用k.get_text()
#tag.get('calss'),也可以达到这个效果

Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

更多关于Python相关内容可查看本站专题:《

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python操作xml文件示例
Apr 07 Python
Python中操作文件之write()方法的使用教程
May 25 Python
python3.5实现socket通讯示例(TCP)
Feb 07 Python
解决Mac安装scrapy失败的问题
Jun 13 Python
pandas数据集的端到端处理
Feb 18 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 Python
通过实例解析Python调用json模块
Dec 11 Python
Python字典中的值为列表或字典的构造实例
Dec 16 Python
Python标准库json模块和pickle模块使用详解
Mar 10 Python
关于matplotlib-legend 位置属性 loc 使用说明
May 16 Python
python实现模拟器爬取抖音评论数据的示例代码
Jan 06 Python
解决Python二维数组赋值问题
Nov 28 #Python
python之array赋值技巧分享
Nov 28 #Python
python3 实现函数写文件路径的正确方法
Nov 27 #Python
关于Python3 lambda函数的深入浅出
Nov 27 #Python
python3中rank函数的用法
Nov 27 #Python
Python values()与itervalues()的用法详解
Nov 27 #Python
python3 assert 断言的使用详解 (区别于python2)
Nov 27 #Python
You might like
ftp类(example.php)
2006/10/09 PHP
Yii2 输出xml格式数据的方法
2016/05/03 PHP
PHP加密技术的简单实现
2016/09/04 PHP
PHP二维数组实现去除重复项的方法【保留各个键值】
2017/12/21 PHP
PHP实现数组根据某个单元字段排序操作示例
2018/08/01 PHP
JavaScript监测ActiveX控件是否已经安装过的代码
2008/09/02 Javascript
JQuery的ajax获取数据后的处理总结(html,xml,json)
2010/07/14 Javascript
jquery 获取自定义属性(attr和prop)的实现代码
2012/06/27 Javascript
JS实现Enter键跳转及控件获得焦点
2013/08/12 Javascript
node.js中的console.assert方法使用说明
2014/12/10 Javascript
json实现添加、遍历与删除属性的方法
2016/06/17 Javascript
完美解决jQuery 鼠标快速滑过后,会执行多次滑出的问题
2016/12/08 Javascript
vue.js整合mint-ui里的轮播图实例代码
2017/12/27 Javascript
使用Ajax和Jquery配合数据库实现下拉框的二级联动的示例
2018/01/25 jQuery
原生JavaScript实现的简单放大镜效果示例
2018/02/07 Javascript
原生js实现省市区三级联动代码分享
2018/02/12 Javascript
JS常见DOM节点操作示例【创建 ,插入,删除,复制,查找】
2018/05/14 Javascript
Vue CLI3 如何支持less的方法示例
2018/08/29 Javascript
jquery绑定事件 bind和on的用法与区别分析
2020/05/22 jQuery
解决vue做详情页跳转的时候使用created方法 数据不会更新问题
2020/07/24 Javascript
[01:13:51]TNC vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python代理抓取并验证使用多线程实现
2013/05/03 Python
Python 错误和异常代码详解
2018/01/29 Python
Python OpenCV处理图像之滤镜和图像运算
2018/07/10 Python
python list格式数据excel导出方法
2018/10/31 Python
Scrapy框架介绍之Puppeteer渲染的使用
2020/06/19 Python
python爬虫 requests-html的使用
2020/11/30 Python
python中openpyxl和xlsxwriter对Excel的操作方法
2021/03/01 Python
Brasty罗马尼亚:购买手表、香水、化妆品、珠宝
2020/04/21 全球购物
什么是Rollback Segment
2013/04/22 面试题
运动会开幕式邀请函
2014/02/03 职场文书
道德演讲稿
2014/05/21 职场文书
班级口号大全
2014/06/09 职场文书
学校党的群众路线教育实践活动总结报告
2014/07/03 职场文书
暑假学习心得体会
2014/09/02 职场文书
面试中canvas绘制图片模糊图片问题处理
2022/03/13 Javascript