python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python BeautifulSoup设置页面编码的方法
Apr 03 Python
详解Django中的ifequal和ifnotequal标签使用
Jul 16 Python
python Django框架实现自定义表单提交
Mar 25 Python
浅析AST抽象语法树及Python代码实现
Jun 06 Python
Python中使用bidict模块双向字典结构的奇技淫巧
Jul 12 Python
Python贪吃蛇游戏编写代码
Oct 26 Python
Python实现的爬取网易动态评论操作示例
Jun 06 Python
对python多线程与global变量详解
Nov 09 Python
python 使用正则表达式按照多个空格分割字符的实例
Dec 20 Python
python对于requests的封装方法详解
Jan 03 Python
Python列表元素常见操作简单示例
Oct 25 Python
如何使用Python自动生成报表并以邮件发送
Oct 15 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
使用zend studio for eclipse不能激活代码提示功能的解决办法
2009/10/11 PHP
整理的9个实用的PHP库简介和下载
2010/11/09 PHP
PHP解码unicode编码的中文字符代码分享
2014/08/13 PHP
php不使用copy()函数复制文件的方法
2015/03/13 PHP
再推荐十款免费的php开发工具
2015/11/09 PHP
Zend Framework基本页面布局分析
2016/03/19 PHP
functional继承模式 摘自javascript:the good parts
2011/06/20 Javascript
javascript页面加载完执行事件代码
2014/02/11 Javascript
一个JavaScript用逗号分割字符串实例
2014/09/22 Javascript
BootStrap.css 在手机端滑动时右侧出现空白的原因及解决办法
2016/06/07 Javascript
JavaScript严格模式详解
2017/01/16 Javascript
jQuery实现右侧抽屉式在线客服功能
2017/12/25 jQuery
vue初尝试--项目结构(推荐)
2018/01/30 Javascript
vue中$refs的用法及作用详解
2018/04/24 Javascript
Three.js中矩阵和向量的使用教程
2019/03/19 Javascript
[40:04]Secret vs Infamous 2019国际邀请赛淘汰赛 败者组 BO3 第二场 8.23
2019/09/05 DOTA
python实现问号表达式(?)的方法
2013/11/27 Python
使用简单工厂模式来进行Python的设计模式编程
2016/03/01 Python
Python的消息队列包SnakeMQ使用初探
2016/06/29 Python
python 上下文管理器使用方法小结
2017/10/10 Python
Django + Uwsgi + Nginx 实现生产环境部署的方法
2018/06/20 Python
利用Python进行数据可视化常见的9种方法!超实用!
2018/07/11 Python
python实现决策树分类(2)
2018/08/30 Python
python射线法判断检测点是否位于区域外接矩形内
2019/06/28 Python
python使用多线程编写tcp客户端程序
2019/09/02 Python
python 统计文件中的字符串数目示例
2019/12/24 Python
python matplotlib实现将图例放在图外
2020/04/17 Python
ASP.NET Core中的配置详解
2021/02/05 Python
英格兰橄榄球商店:England Rugby Store
2016/12/17 全球购物
Servlet的生命周期
2013/08/25 面试题
房屋转让协议书
2014/04/11 职场文书
幼儿教师师德师风自我评价
2015/03/05 职场文书
2016年小学生寒假总结
2015/10/10 职场文书
Golang中interface{}转为数组的操作
2021/04/30 Golang
Nginx+Tomcat负载均衡多实例详解
2022/04/11 Servers
Python+SeaTable实现计算两个日期间的工作日天数
2022/07/07 Python