python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详细探究Python中的字典容器
Apr 14 Python
python获得一个月有多少天的方法
Jun 04 Python
python实现百万答题自动百度搜索答案
Jan 16 Python
PyQt5 QSerialPort子线程操作的实现
Apr 21 Python
Flask-Mail用法实例分析
Jul 21 Python
Python3实现取图片中特定的像素替换指定的颜色示例
Jan 24 Python
Django 使用easy_thumbnails压缩上传的图片方法
Jul 26 Python
使用python实现kNN分类算法
Oct 16 Python
pygame实现打字游戏
Feb 19 Python
Python 多线程共享变量的实现示例
Apr 17 Python
Python何绘制带有背景色块的折线图
Apr 23 Python
Python sklearn分类决策树方法详解
Sep 23 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
php设计模式 Command(命令模式)
2011/06/26 PHP
php中替换字符串中的空格为逗号','的方法
2014/06/09 PHP
PHP基于ip2long实现IP转换整形
2020/12/11 PHP
JavaScript中的prototype使用说明
2010/04/13 Javascript
js/html光标定位的实现代码
2013/09/23 Javascript
JQuery伸缩导航练习示例
2013/11/13 Javascript
js浮点数保留两位小数点示例代码(四舍五入)
2013/12/26 Javascript
JS组件中bootstrap multiselect两大组件较量
2016/01/26 Javascript
Angular实现form自动布局
2016/01/28 Javascript
常用的js验证和数据处理总结
2016/08/02 Javascript
Jquery实现上下移动和排序代码
2016/10/17 Javascript
View.post() 不靠谱的地方你知道多少
2017/08/29 Javascript
javaScript实现滚动条事件详解
2020/03/24 Javascript
浅析Vue中method与computed的区别
2018/03/06 Javascript
JavaScript实现文件下载并重命名代码实例
2019/12/12 Javascript
Vue实现Header渐隐渐现效果的实例代码
2020/11/05 Javascript
[45:32]Liquid vs LGD 2018国际邀请赛淘汰赛BO3 第二场 8.23
2018/08/24 DOTA
Python 通过pip安装Django详细介绍
2017/04/28 Python
Python实现的求解最大公约数算法示例
2018/05/03 Python
Python实现ping指定IP的示例
2018/06/04 Python
Django框架文件上传与自定义图片上传路径、上传文件名操作分析
2019/05/10 Python
pyqt 实现在Widgets中显示图片和文字的方法
2019/06/13 Python
梅尔倒谱系数(MFCC)实现
2019/06/19 Python
详解CSS3原生支持div铺满浏览器的方法
2018/08/30 HTML / CSS
Html5 实现微信分享及自定义内容的流程
2019/08/20 HTML / CSS
英国品牌男装折扣网站:Brown Bag
2018/03/08 全球购物
实习生的自我评价
2014/01/08 职场文书
艺人经纪人岗位职责
2014/04/15 职场文书
《东方明珠》教学反思
2014/04/20 职场文书
初中新生军训方案
2014/05/13 职场文书
社会体育专业大学生职业生涯规划书
2014/09/17 职场文书
婚育证明格式
2015/06/17 职场文书
学校运动会简讯
2015/07/20 职场文书
2016优秀大学生个人事迹材料范文
2016/03/01 职场文书
导游词之重庆钓鱼城
2019/09/19 职场文书
我收到了德劲DE1107
2022/04/05 无线电