编程 Python

Python爬取京东的商品分类与链接

Posted in Python onAugust 26, 2016

前言

本文主要的知识点是使用Python的BeautifulSoup进行多层的遍历。

Python爬取京东的商品分类与链接

如图所示。只是一个简单的哈，不是爬取里面的隐藏的东西。

示例代码

from bs4 import BeautifulSoup as bs
import requests
headers = {
  "host": "www.jd.com",
  "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36 Core/1.47.933.400 QQBrowser/9.4.8699.400",
  "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8"
  }
session = requests.session()
def get_url():
  renspned = bs(session.get('http://www.jd.com/',headers = headers).text,'html.parser')
  for i in renspned.find("div", {"class": "dd-inner"}).find_all("a",{"target":"_blank"}):
    print(i.get_text(),':',i.get('href'))
get_url()

运行这段代码以及达到了我们的目的。

Python爬取京东的商品分类与链接

我们来解读一下这段代码。

首先我们要访问到京东的首页。

然后通过BeautifulSoup对访问到的首页进行解析。

这个时候，我们就要定位元素，来获取我们需要的东西了。

在浏览器中通过F12，我们可以看到下图所示的东西：

Python爬取京东的商品分类与链接

我们来看看下面这句代码：

for i in renspned.find("div", {"class": "dd-inner"}).find_all("a",{"target":"_blank"})

这一行代码完全满足我们的需求，首先用find方法，定位到了class=“dd-inner”的div，然后使用find_all对该标签下所有的a标签。

最后，我想打印出所有的商品分类以及对应的链接，于是，我使用了i.get_text()和i.get('href')的方法终于获取到了商品分类和对应的链接。

总结

其实不是很难，主要是要用对方法。笔者因为是初学方法没有用对。花了差不多两天时间才搞定。这里也是告诉大家，可以使用find().find_all()的方法进行多层的遍历。以上就是我利用Python爬取京东的商品分类与链接的一些经验，希望对大家学习python能有所帮助。

Python爬取京东的商品分类与链接

- Author -

Rookie_C

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python模拟登录验证码（代码简单）

Feb 06 Python

Python的Flask框架中的Jinja2模板引擎学习教程

Jun 30 Python

快速实现基于Python的微信聊天机器人示例代码

Mar 03 Python

python 数据的清理行为实例详解

Jul 12 Python

Python中函数eval和ast.literal_eval的区别详解

Aug 10 Python

通过Python实现自动填写调查问卷

Sep 06 Python

在PyCharm中控制台输出日志分层级分颜色显示的方法

Jul 11 Python

Django 反向生成url实例详解

Jul 30 Python

在Python IDLE 下调用anaconda中的库教程

Mar 09 Python

QML用PathView实现轮播图

Jun 03 Python

使用tensorflow根据输入更改tensor shape

Jun 23 Python

Python 实现一个简单的web服务器

Jan 03 Python

Python设计模式之抽象工厂模式

Aug 25 #Python

简单谈谈python中的Queue与多进程

Aug 25 #Python

利用Python自动监控网站并发送邮件告警的方法

Aug 24 #Python

巧用python和libnmapd,提取Nmap扫描结果

Aug 23 #Python

Python中属性和描述符的正确使用

Aug 23 #Python

Python实现基本线性数据结构

Aug 22 #Python

Python进行数据提取的方法总结

Aug 22 #Python