python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现查询苹果手机维修进度
Mar 16 Python
Python基于pygame实现的弹力球效果(附源码)
Nov 11 Python
深入理解 Python 中的多线程 新手必看
Nov 20 Python
Python正则表达式教程之三:贪婪/非贪婪特性
Mar 02 Python
python3下实现搜狗AI API的代码示例
Apr 10 Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 Python
在django admin中配置搜索域是一个外键时的处理方法
May 20 Python
学习python需要有编程基础吗
Jun 02 Python
Python中猜拳游戏与猜筛子游戏的实现方法
Sep 04 Python
python 获取字典键值对的实现
Nov 12 Python
将不规则的Python多维数组拉平到一维的方法实现
Jan 11 Python
python解析json数据
Apr 29 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
PHP获取当前页面URL函数实例
2014/10/22 PHP
如何使用微信公众平台开发模式实现多客服
2016/01/06 PHP
PHP面向对象学习之parent::关键字
2017/01/18 PHP
thinkPHP3.2.3结合Laypage实现的分页功能示例
2018/05/28 PHP
针对thinkPHP5框架存储过程bug重写的存储过程扩展类完整实例
2018/06/16 PHP
IE中getElementsByName()对有些元素无效的解决方案
2014/09/28 Javascript
基于zepto.js实现仿手机QQ空间的大图查看组件ImageView.js详解
2015/03/05 Javascript
Javascript实现快速排序(Quicksort)的算法详解
2015/09/06 Javascript
input 禁止输入特殊字符的四种实现方式
2016/08/24 Javascript
JavaScript 保护变量不被随意修改的实现代码
2017/09/27 Javascript
vue2过滤器模糊查询方法
2018/09/16 Javascript
js正则取值的结果数组调试方法
2018/10/10 Javascript
NodeJs实现简易WEB上传下载服务器
2019/08/10 NodeJs
Python中实现远程调用(RPC、RMI)简单例子
2014/04/28 Python
Ruby使用eventmachine为HTTP服务器添加文件下载功能
2016/04/20 Python
Python实现正整数分解质因数操作示例
2018/08/01 Python
Random 在 Python 中的使用方法
2018/08/09 Python
Python 旋转打印各种矩形的方法
2019/07/09 Python
解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题
2019/07/15 Python
Djang的model创建的字段和参数详解
2019/07/27 Python
python3.7实现云之讯、聚合短信平台的短信发送功能
2019/09/26 Python
python+Django实现防止SQL注入的办法
2019/10/31 Python
Python异常继承关系和自定义异常实现代码实例
2020/02/20 Python
Python+PyQt5+MySQL实现天气管理系统
2020/06/16 Python
PyCharm2020最新激活码+激活码补丁(亲测最新版PyCharm2020.2激活成功)
2020/11/25 Python
求职自荐信格式
2013/12/04 职场文书
培训演讲稿范文
2014/01/12 职场文书
优秀医生事迹材料
2014/02/12 职场文书
中文教师求职信
2014/02/22 职场文书
班风学风建设方案
2014/05/06 职场文书
奥林匹克运动会口号
2014/06/19 职场文书
责任书范本
2014/08/25 职场文书
关于长城的导游词
2015/01/30 职场文书
在职证明范本
2015/06/15 职场文书
my.ini优化mysql数据库性能的十个参数(推荐)
2021/05/26 MySQL
详解Go语言Slice作为函数参数的使用
2021/07/02 Golang