python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例


Posted in Python onNovember 28, 2019

本文实例讲述了python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据。分享给大家供大家参考,具体如下:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()
html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文档对象
#查找a标签,只会查找出一个a标签
#print(soup.a)#<a class="sister" href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" id="xiaodeng"><!-- Elsie --></a>
for k in soup.find_all('a'):
 print(k)
 print(k['class'])#查a标签的class属性
 print(k['id'])#查a标签的id值
 print(k['href'])#查a标签的href值
 print(k.string)#查a标签的string
#如果,标签中含有其他标签,比如..,此时要提取中的数据,需要用k.get_text()
#tag.get('calss'),也可以达到这个效果

Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

更多关于Python相关内容可查看本站专题:《

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python文件的md5加密方法
Apr 06 Python
Python函数的周期性执行实现方法
Aug 13 Python
Python多进程multiprocessing用法实例分析
Aug 18 Python
Python爬取qq空间说说的实例代码
Aug 17 Python
python中property属性的介绍及其应用详解
Aug 29 Python
python BlockingScheduler定时任务及其他方式的实现
Sep 19 Python
使用python绘制二维图形示例
Nov 22 Python
Tensorflow 实现释放内存
Feb 03 Python
Python图像处理库PIL的ImageFont模块使用介绍
Feb 26 Python
python 实现朴素贝叶斯算法的示例
Sep 30 Python
python小程序之飘落的银杏
Apr 17 Python
Python学习开发之图形用户界面详解
Aug 23 Python
解决Python二维数组赋值问题
Nov 28 #Python
python之array赋值技巧分享
Nov 28 #Python
python3 实现函数写文件路径的正确方法
Nov 27 #Python
关于Python3 lambda函数的深入浅出
Nov 27 #Python
python3中rank函数的用法
Nov 27 #Python
Python values()与itervalues()的用法详解
Nov 27 #Python
python3 assert 断言的使用详解 (区别于python2)
Nov 27 #Python
You might like
献给php初学者(入门学习经验谈)
2010/10/12 PHP
[原创]CI(CodeIgniter)简单统计访问人数实现方法
2016/01/19 PHP
CI框架的安全性分析
2016/05/18 PHP
类似CSDN图片切换效果脚本
2009/09/17 Javascript
JavaScript 基于原型的对象(创建、调用)
2009/10/16 Javascript
javascript实现日历控件(年月日关闭按钮)
2012/12/12 Javascript
文本框(input)获取焦点(onfocus)时样式改变的示例代码
2014/01/10 Javascript
用jquery写的菜单从左往右滑动出现
2014/04/11 Javascript
node.js中的fs.symlinkSync方法使用说明
2014/12/15 Javascript
JQuery+CSS实现图片上放置按钮的方法
2015/05/29 Javascript
JavaScript中字面量与函数的基本使用知识
2015/10/20 Javascript
Javascript技术难点之apply,call与this之间的衔接
2015/12/04 Javascript
鼠标悬停小图标显示大图标
2016/01/22 Javascript
JS三目运算(三元运算)方法详解
2017/03/01 Javascript
jQuery Validate表单验证插件实现代码
2017/06/08 jQuery
jquery实现楼层滚动效果
2018/01/01 jQuery
vuex的简单使用教程
2018/02/02 Javascript
ES6学习笔记之map、set与数组、对象的对比
2018/03/01 Javascript
Angular angular-file-upload文件上传的示例代码
2018/08/23 Javascript
如何利用JavaScript编写更好的条件语句详解
2020/08/10 Javascript
Python部署web开发程序的几种方法
2017/05/05 Python
使用Python来做一个屏幕录制工具的操作代码
2020/01/18 Python
解决Jupyter无法导入已安装的 module问题
2020/04/17 Python
使用JS+CSS3技术:让你的名字动起来
2013/04/27 HTML / CSS
丝芙兰巴西官方商城:SEPHORA巴西
2016/10/31 全球购物
是否有自动比较结构的方法
2015/06/03 面试题
个人简历自我评价八例
2013/10/31 职场文书
一封普通求职者的求职信
2013/11/20 职场文书
关于幼儿的自我评价
2013/12/18 职场文书
万年牢教学反思
2014/02/15 职场文书
2014年两会学习心得体会
2014/03/17 职场文书
婚纱摄影师求职信范文
2014/04/17 职场文书
大学活动总结模板
2014/07/10 职场文书
监察局领导班子四风问题整改措施思想汇报
2014/10/05 职场文书
优秀教师事迹材料
2014/12/15 职场文书
公司财务经理岗位职责
2015/04/08 职场文书