python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python采集腾讯新闻实例
Jul 10 Python
详解Python在七牛云平台的应用(一)
Dec 05 Python
Python中实现switch功能实例解析
Jan 11 Python
tensorflow实现softma识别MNIST
Mar 12 Python
Python中判断子串存在的性能比较及分析总结
Jun 23 Python
Django框架下静态模板的继承操作示例
Nov 08 Python
使用python快速在局域网内搭建http传输文件服务的方法
Nov 14 Python
python的time模块和datetime模块实例解析
Nov 29 Python
Django ForeignKey与数据库的FOREIGN KEY约束详解
May 20 Python
Python Socket TCP双端聊天功能实现过程详解
Jun 15 Python
Python执行时间的几种计算方法
Jul 31 Python
python中@contextmanager实例用法
Feb 07 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
基于mysql的论坛(5)
2006/10/09 PHP
Apache服务器下防止图片盗链的办法
2015/07/06 PHP
创建无限极分类树型结构的简单方法
2017/06/20 PHP
PHP简单实现正则匹配省市区的方法
2018/04/13 PHP
Swoole4.4协程抢占式调度器详解
2019/05/23 PHP
laravel实现查询最后执行的一条sql语句的方法
2019/10/09 PHP
jQuery Mobile 导航栏代码
2013/11/01 Javascript
AngularJS初始化过程分析(引导程序)
2014/12/06 Javascript
nodejs事件的监听与触发的理解分析
2015/02/12 NodeJs
jquery关于事件冒泡和事件委托的技巧及阻止与允许事件冒泡的三种实现方法
2015/11/27 Javascript
JS操作JSON方法总结(推荐)
2016/06/14 Javascript
angularJS+requireJS实现controller及directive的按需加载示例
2017/02/20 Javascript
动态加载权限管理模块中的Vue组件
2018/01/16 Javascript
vue.js实现的幻灯片功能示例
2019/01/18 Javascript
基于AngularJS拖拽插件ngDraggable.js实现拖拽排序功能
2019/04/02 Javascript
详解JavaScript数据类型和判断方法
2020/09/04 Javascript
记一次vue跨域的解决
2020/10/21 Javascript
编写v-for循环的技巧汇总
2020/12/01 Javascript
[00:42]《辉夜杯》—职业组预选赛12月3日15点 正式打响
2015/12/03 DOTA
Python scikit-learn 做线性回归的示例代码
2017/11/01 Python
Python3利用Dlib实现摄像头实时人脸检测和平铺显示示例
2019/02/21 Python
django settings.py 配置文件及介绍
2019/07/15 Python
Python接口测试数据库封装实现原理
2020/05/09 Python
tensorflow与numpy的版本兼容性问题的解决
2021/01/08 Python
荷兰和比利时时尚鞋店:Van Dalen
2018/04/23 全球购物
Koral官方网站:女性时尚运动服
2019/04/10 全球购物
Servlet的实例是在生命周期什么时候创建的?配置servlet最重要的是什么?
2012/05/30 面试题
会计电算化专业个人的自我评价
2013/11/24 职场文书
汽车技术服务英文求职信范文
2014/01/02 职场文书
领导证婚人证婚词
2014/01/13 职场文书
四风对照检查材料范文
2014/09/27 职场文书
证券区域经理岗位职责
2015/04/10 职场文书
入党转正介绍人意见
2015/06/03 职场文书
2019年XX公司的晨会制度及流程!
2019/07/23 职场文书
浅谈TypeScript 索引签名的理解
2021/10/16 Javascript
python编程实现清理微信重复缓存文件
2021/11/01 Python