python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用分治法实现求解最大值的方法
May 12 Python
使用python生成目录树
Mar 29 Python
在OpenCV里使用特征匹配和单映射变换的代码详解
Oct 23 Python
解决python web项目意外关闭,但占用端口的问题
Dec 17 Python
用python3读取python2的pickle数据方式
Dec 25 Python
基于Python执行dos命令并获取输出的结果
Dec 30 Python
python读取文件指定行内容实例讲解
Mar 02 Python
Opencv求取连通区域重心实例
Jun 04 Python
PyQt5-QDateEdit的简单使用操作
Jul 12 Python
如何Tkinter模块编写Python图形界面
Oct 14 Python
MoviePy简介及Python视频剪辑自动化
Dec 18 Python
详解Python常用的魔法方法
Jun 03 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
在Debian系统下配置LNMP的教程
2015/07/09 PHP
如何使用Gitblog和Markdown建自己的博客
2015/07/31 PHP
PHP实现微信网页授权开发教程
2016/01/19 PHP
PHP XML和数组互相转换详解
2016/10/26 PHP
Yii框架用户登录session丢失问题解决方法
2017/01/07 PHP
利用js跨页面保存变量做菜单的方法
2008/01/17 Javascript
jquery.jstree 增加节点的双击事件代码
2010/07/27 Javascript
JavaScript日历实现代码
2010/09/12 Javascript
深入理解javascript变量声明
2014/11/20 Javascript
自定义函数实现IE7与IE8不兼容js中trim函数的问题
2015/02/03 Javascript
jQuery判断是否存在滚动条的简单方法
2016/09/17 Javascript
微信小程序实战之自定义toast(6)
2017/04/18 Javascript
JavaScript实现离开页面前提示功能【附jQuery实现方法】
2017/09/26 jQuery
webuploader分片上传的实现代码(前后端分离)
2018/09/10 Javascript
[45:14]Optic vs VP 2018国际邀请赛淘汰赛BO3 第二场 8.24
2018/08/25 DOTA
Python多线程编程(一):threading模块综述
2015/04/05 Python
Django+JS 实现点击头像即可更改头像的方法示例
2018/12/26 Python
python for 循环获取index索引的方法
2019/02/01 Python
Python Scrapy框架第一个入门程序示例
2020/02/05 Python
Python利用Xpath选择器爬取京东网商品信息
2020/06/01 Python
Python基于字典实现switch case函数调用
2020/07/22 Python
python Protobuf定义消息类型知识点讲解
2021/03/02 Python
法国美发器材和产品购物网站:Beauty Coiffure
2016/12/05 全球购物
Vans(范斯)德国官网:美国南加州的原创极限运动潮牌
2017/05/02 全球购物
Smashbox英国官网:美国知名彩妆品牌
2017/11/13 全球购物
WWE美国职业摔角官方商店:WWE Shop
2018/11/15 全球购物
大四学年自我鉴定
2013/11/13 职场文书
前台领班岗位职责
2013/12/04 职场文书
高一新生军训感言
2014/03/02 职场文书
幼教求职信
2014/03/12 职场文书
党员公开承诺书
2014/03/25 职场文书
羽毛球社团活动总结
2014/06/27 职场文书
三八红旗手事迹材料
2014/12/26 职场文书
5.12护士节活动总结
2015/02/10 职场文书
Idea连接MySQL数据库出现中文乱码的问题
2021/04/14 MySQL
Python使用UDP实现720p视频传输的操作
2021/04/24 Python