python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python实现拉钩网上的FizzBuzzWhizz问题示例
May 05 Python
处理Python中的URLError异常的方法
Apr 30 Python
python 2.6.6升级到python 2.7.x版本的方法
Oct 09 Python
详解python基础之while循环及if判断
Aug 24 Python
Python实现二维数组输出为图片
Apr 03 Python
Python3实现获取图片文字里中文的方法分析
Dec 13 Python
Python中的枚举类型示例介绍
Jan 09 Python
Python切片操作去除字符串首尾的空格
Apr 22 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 Python
python实现美团订单推送到测试环境,提供便利操作示例
Aug 09 Python
Python协程操作之gevent(yield阻塞,greenlet),协程实现多任务(有规律的交替协作执行)用法详解
Oct 14 Python
Anaconda配置pytorch-gpu虚拟环境的图文教程
Apr 16 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
PHP中对用户身份认证实现两种方法
2011/06/04 PHP
深入解析yii权限分级式访问控制的实现(非RBAC法)
2013/06/13 PHP
yii的入口文件index.php中为什么会有这两句
2016/08/04 PHP
php.ini中date.timezone设置详解
2016/11/20 PHP
yii2-GridView在开发中常用的功能及技巧总结
2017/01/07 PHP
PHP二维数组实现去除重复项的方法【保留各个键值】
2017/12/21 PHP
JQuery扩展插件Validate—6 radio、checkbox、select的验证
2011/09/05 Javascript
javascript椭圆旋转相册实现代码
2012/01/16 Javascript
js修改input的type属性问题探讨
2013/10/12 Javascript
鼠标滚轮改变图片大小的示例代码
2013/11/20 Javascript
js实现从中间开始往上下展开网页窗口的方法
2015/03/02 Javascript
简单介绍JavaScript的变量和数据类型
2015/06/03 Javascript
jQuery动态添加及删除表单上传元素的方法(附demo源码下载)
2016/01/15 Javascript
理解JavaScript事件对象
2016/01/25 Javascript
js实现三级联动效果(简单易懂)
2017/03/27 Javascript
微信小程序switch组件使用详解
2018/01/31 Javascript
vue中子组件调用兄弟组件方法
2018/07/06 Javascript
JointJS流程图的绘制方法
2018/12/03 Javascript
vue中axios实现数据交互与跨域问题
2019/05/12 Javascript
layui默认选中table的CheckBox复选框方法
2019/09/19 Javascript
JS+HTML5本地存储Localstorage实现注册登录及验证功能示例
2020/02/10 Javascript
vuex中store存储store.commit和store.dispatch的用法
2020/07/24 Javascript
在vscode 中设置 vue模板内容的方法
2020/09/02 Javascript
python中实现数组和列表读取一列的方法
2018/04/03 Python
pandas将numpy数组写入到csv的实例
2018/07/04 Python
Tensorflow分类器项目自定义数据读入的实现
2019/02/05 Python
python使用matplotlib绘制雷达图
2019/10/18 Python
利用Python裁切tiff图像且读取tiff,shp文件的实例
2020/03/10 Python
详解如何修改python中字典的键和值
2020/09/29 Python
Python高并发和多线程有什么关系
2020/11/14 Python
Charles&Keith美国官方网站:新加坡快时尚鞋类和配饰零售商
2019/11/27 全球购物
门卫岗位职责
2013/11/15 职场文书
学校标语大全
2014/06/19 职场文书
2015年语文教师工作总结
2015/05/25 职场文书
Python Matplotlib绘制两个Y轴图像
2022/04/13 Python
Spring boot admin 服务监控利器详解
2022/08/05 Java/Android