python 3利用BeautifulSoup抓取div标签的方法示例


Posted in Python onMay 28, 2017

前言

本文主要介绍的是关于python 3用BeautifulSoup抓取div标签的方法示例,分享出来供大家参考学习,下面来看看详细的介绍:

示例代码:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作


from bs4 import BeautifulSoup
import urllib.request
import re


#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()



html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<div class="ntopbar_loading"><img src="http://simg.sinajs.cn/blog7style/images/common/loading.gif">加载中…</div>

<div class="SG_connHead">
   <span class="title" comp_title="个人资料">个人资料</span>
   <span class="edit">
      </span>
<div class="info_list">  
         <ul class="info_list1">
     <li><span class="SG_txtc">博客等级:</span><span id="comp_901_grade"><img src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src="http://simg.sinajs.cn/blog7style/images/common/number/9.gif" /></span></li>
     <li><span class="SG_txtc">博客积分:</span><span id="comp_901_score"><strong>0</strong></span></li>
     </ul>
     <ul class="info_list2">
     <li><span class="SG_txtc">博客访问:</span><span id="comp_901_pv"><strong>3,971</strong></span></li>
     <li><span class="SG_txtc">关注人气:</span><span id="comp_901_attention"><strong>0</strong></span></li>
     <li><span class="SG_txtc">获赠金笔:</span><strong id="comp_901_d_goldpen">0支</strong></li>
     <li><span class="SG_txtc">赠出金笔:</span><strong id="comp_901_r_goldpen">0支</strong></li>
     <li class="lisp" id="comp_901_badge"><span class="SG_txtc">荣誉徽章:</span></li>
     </ul>
     </div>
<div class="atcTit_more"><span class="SG_more"><a href="http://blog.sina.com.cn/" rel="external nofollow" rel="external nofollow" target="_blank">更多>></a></span></div>     
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文档对象



# 类名为xxx而且文本内容为hahaha的div
for k in soup.find_all('div',class_='atcTit_more'):#,string='更多'
 print(k)
 #<div class="atcTit_more"><span class="SG_more"><a href="http://blog.sina.com.cn/" rel="external nofollow" rel="external nofollow" target="_blank">更多>></a></span></div>

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家三水点靠木的支持。

Python 相关文章推荐
python实现删除文件与目录的方法
Nov 10 Python
Python函数中*args和**kwargs来传递变长参数的用法
Jan 26 Python
python3大文件解压和基本操作
Dec 15 Python
python将文本分每两行一组并保存到文件
Mar 19 Python
python调用摄像头显示图像的实例
Aug 03 Python
python游戏地图最短路径求解
Jan 16 Python
对python中的os.getpid()和os.fork()函数详解
Aug 08 Python
Python实现ATM系统
Feb 17 Python
Tensorflow之梯度裁剪的实现示例
Mar 08 Python
Python使用graphviz画流程图过程解析
Mar 31 Python
pytorch查看模型weight与grad方式
Jun 24 Python
解决numpy数组互换两行及赋值的问题
Apr 17 Python
Python虚拟环境virtualenv的安装与使用详解
May 28 #Python
python 调用win32pai 操作cmd的方法
May 28 #Python
Python 稀疏矩阵-sparse 存储和转换
May 27 #Python
Django基础之Model操作步骤(介绍)
May 27 #Python
python之PyMongo使用总结
May 26 #Python
Python3安装Pymongo详细步骤
May 26 #Python
Python计时相关操作详解【time,datetime】
May 26 #Python
You might like
中英文字符串翻转函数
2008/12/09 PHP
php 阴历-农历-转换类代码
2012/01/16 PHP
深入浅出php socket编程
2015/05/13 PHP
利用php抓取蜘蛛爬虫痕迹的示例代码
2016/09/30 PHP
Laravel模型间关系设置分表的方法示例
2018/04/21 PHP
javascript基础的动画教程,直观易懂
2007/01/10 Javascript
javascript中的注释使用与注意事项小结
2011/09/20 Javascript
最佳的addEvent事件绑定是怎样诞生的
2011/10/24 Javascript
JQuery学习笔录 简单的JQuery
2012/04/09 Javascript
浅谈JavaScript函数参数的可修改性问题
2013/12/05 Javascript
js实现不提交表单获取单选按钮值的方法
2015/08/21 Javascript
JS封装cookie操作函数实例(设置、读取、删除)
2015/11/17 Javascript
jQuery 弹出层插件(推荐)
2016/05/24 Javascript
Angular2 组件通信的实例代码
2017/06/23 Javascript
js原生代码实现轮播图的实例讲解
2017/07/28 Javascript
vue按需引入element Transfer 穿梭框
2017/09/30 Javascript
bootstrap 点击空白处popover弹出框隐藏实例
2018/01/24 Javascript
VUE重点问题总结
2018/03/19 Javascript
bootstrap动态调用select下拉框的实例代码
2018/08/09 Javascript
vue实现条件判断动态绑定样式的方法
2018/09/29 Javascript
编写一个javascript元循环求值器的方法
2020/04/14 Javascript
vue.js 解决v-model让select默认选中不生效的问题
2020/07/28 Javascript
实现vuex原理的示例
2020/10/21 Javascript
[05:02]2014DOTA2 TI中国区预选赛精彩TOPPLAY第三弹
2014/06/25 DOTA
[01:38]【DOTA2亚洲邀请赛】Sumail——梦开始的地方
2017/03/03 DOTA
Python中的异常处理相关语句基础学习笔记
2016/07/11 Python
wxPython多个窗口的基本结构
2019/11/19 Python
借助Paramiko通过Python实现linux远程登陆及sftp的操作
2020/03/16 Python
有影响力的品牌之家:Our Social Collective
2019/06/08 全球购物
Wiggle新西兰:自行车、跑步、游泳
2020/05/06 全球购物
企业员工培训感言
2014/02/26 职场文书
志愿者活动总结范文
2014/04/26 职场文书
祖国在我心中演讲稿200字
2014/08/28 职场文书
复制别人的成功真的会成功吗?
2019/10/17 职场文书
你知道哪几种MYSQL的连接查询
2021/06/03 MySQL
Java面试题冲刺第十七天--基础篇3
2021/08/07 面试题