Python爬取京东的商品分类与链接


Posted in Python onAugust 26, 2016

前言

本文主要的知识点是使用Python的BeautifulSoup进行多层的遍历。

Python爬取京东的商品分类与链接

如图所示。只是一个简单的哈,不是爬取里面的隐藏的东西。

示例代码

from bs4 import BeautifulSoup as bs
import requests
headers = {
  "host": "www.jd.com",
  "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36 Core/1.47.933.400 QQBrowser/9.4.8699.400",
  "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8"
  }
session = requests.session()
def get_url():
  renspned = bs(session.get('http://www.jd.com/',headers = headers).text,'html.parser')
  for i in renspned.find("div", {"class": "dd-inner"}).find_all("a",{"target":"_blank"}):
    print(i.get_text(),':',i.get('href'))
get_url()

运行这段代码以及达到了我们的目的。

Python爬取京东的商品分类与链接

我们来解读一下这段代码。

首先我们要访问到京东的首页。

然后通过BeautifulSoup对访问到的首页进行解析。

这个时候,我们就要定位元素,来获取我们需要的东西了。

在浏览器中通过F12,我们可以看到下图所示的东西:

Python爬取京东的商品分类与链接

我们来看看下面这句代码:

for i in renspned.find("div", {"class": "dd-inner"}).find_all("a",{"target":"_blank"})

这一行代码完全满足我们的需求,首先用find方法,定位到了class=“dd-inner”的div,然后使用find_all对该标签下所有的a标签。

最后,我想打印出所有的商品分类以及对应的链接,于是,我使用了i.get_text()i.get('href')的方法终于获取到了商品分类和对应的链接。

总结

其实不是很难,主要是要用对方法。笔者因为是初学方法没有用对。花了差不多两天时间才搞定。这里也是告诉大家,可以使用find().find_all()的方法进行多层的遍历。以上就是我利用Python爬取京东的商品分类与链接的一些经验,希望对大家学习python能有所帮助。

Python 相关文章推荐
Python常用列表数据结构小结
Aug 06 Python
在Python中使用元类的教程
Apr 28 Python
Django objects.all()、objects.get()与objects.filter()之间的区别介绍
Jun 12 Python
python 实现上传图片并预览的3种方法(推荐)
Jul 14 Python
python图书管理系统
Apr 05 Python
python 解压pkl文件的方法
Oct 25 Python
对Python 除法负数取商的取整方式详解
Dec 12 Python
Django 大文件下载实现过程解析
Aug 01 Python
python爬虫爬取幽默笑话网站
Oct 24 Python
numpy np.newaxis 的实用分享
Nov 30 Python
Python中使用threading.Event协调线程的运行详解
May 02 Python
Keras—embedding嵌入层的用法详解
Jun 10 Python
Python设计模式之抽象工厂模式
Aug 25 #Python
简单谈谈python中的Queue与多进程
Aug 25 #Python
利用Python自动监控网站并发送邮件告警的方法
Aug 24 #Python
巧用python和libnmapd,提取Nmap扫描结果
Aug 23 #Python
Python中属性和描述符的正确使用
Aug 23 #Python
Python实现基本线性数据结构
Aug 22 #Python
Python进行数据提取的方法总结
Aug 22 #Python
You might like
人大复印资料处理程序_查询篇
2006/10/09 PHP
用PHP和ACCESS写聊天室(四)
2006/10/09 PHP
php中存储用户ID和密码到mysql数据库的方法
2013/02/06 PHP
科讯商业版中用到的ajax空间与分页函数
2007/09/02 Javascript
JQuery调webservice实现邮箱验证(检测是否可用)
2013/05/21 Javascript
chrome浏览器不支持onmouseleave事件的解决技巧
2013/05/31 Javascript
ztree获取当前选中节点子节点id集合的方法
2015/02/12 Javascript
jquery网页日历显示控件calendar3.1使用详解
2016/11/24 Javascript
Node.js Express 框架 POST方法详解
2017/01/23 Javascript
Vue数组更新及过滤排序功能
2017/08/10 Javascript
Vuex入门到上手教程
2018/06/20 Javascript
解决layui调用自定义方法提示未定义的问题
2019/09/14 Javascript
JS实现字体背景跑马灯
2020/01/06 Javascript
深入webpack打包原理及loader和plugin的实现
2020/05/06 Javascript
基于JavaScript实现控制下拉列表
2020/05/08 Javascript
javascript自定义加载loading效果
2020/09/15 Javascript
实用的 vue tags 创建缓存导航的过程实现
2020/12/03 Vue.js
vue实现一个获取按键展示快捷键效果的Input组件
2021/01/13 Vue.js
python实现目录树生成示例
2014/03/28 Python
python中函数总结之装饰器闭包详解
2016/06/12 Python
Python实现简单过滤文本段的方法
2017/05/24 Python
Django 多语言教程的实现(i18n)
2018/07/07 Python
python实现逐个读取txt字符并修改
2018/12/24 Python
Python3爬虫全国地址信息
2019/01/05 Python
在python tkinter中Canvas实现进度条显示的方法
2019/06/14 Python
python的一些加密方法及python 加密模块
2019/07/11 Python
Python编程快速上手——PDF文件操作案例分析
2020/02/28 Python
python使用Word2Vec进行情感分析解析
2020/07/31 Python
英国PC组件和在线电脑商店:SCAN
2019/04/18 全球购物
Douglas意大利官网:购买香水和化妆品
2020/05/27 全球购物
生日庆典策划方案
2014/06/02 职场文书
社团个人总结范文
2015/03/05 职场文书
工程质检员岗位职责
2015/04/08 职场文书
党支部综合考察意见
2015/06/01 职场文书
2019年最新证婚词精选集!
2019/06/28 职场文书
html中两种获取标签内的值的方法
2022/06/16 jQuery