python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的凯撒密码算法示例
Apr 12 Python
python 判断网络连通的实现方法
Apr 22 Python
Python自定义一个类实现字典dict功能的方法
Jan 19 Python
使用python分析统计自己微信朋友的信息
Jul 19 Python
python Popen 获取输出,等待运行完成示例
Dec 30 Python
Python Handler处理器和自定义Opener原理详解
Mar 05 Python
解决IDEA 的 plugins 搜不到任何的插件问题
May 04 Python
python实现简单遗传算法
Sep 18 Python
Python结合百度语音识别实现实时翻译软件的实现
Jan 18 Python
python爬虫爬取某网站视频的示例代码
Feb 20 Python
sklearn中的交叉验证的实现(Cross-Validation)
Feb 22 Python
Python实现制作销售数据可视化看板详解
Nov 27 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
回答PHPCHINA上的几个问题:URL映射
2007/02/14 PHP
qq登录,新浪微博登录接口申请过程中遇到的问题
2014/07/22 PHP
PHP中echo,print_r与var_dump区别分析
2014/09/29 PHP
php遍历目录方法小结
2015/03/10 PHP
解决nginx不支持thinkphp中pathinfo的问题
2015/07/21 PHP
PHP结合Mysql数据库实现留言板功能
2016/03/04 PHP
基于jquery的多功能软键盘插件
2012/07/25 Javascript
javascript中注册和移除事件的4种方式
2013/03/20 Javascript
JQuery 操作/获取table具体代码
2013/06/13 Javascript
jquery给图片添加鼠标经过时的边框效果
2013/11/12 Javascript
JavaScript 32位整型无符号操作示例
2013/12/08 Javascript
javascript中parentNode,childNodes,children的应用详解
2013/12/17 Javascript
使用 jQuery.ajax 上传带文件的表单遇到的问题
2016/10/31 Javascript
jquery ajaxfileupload异步上传插件使用详解
2017/02/08 Javascript
nodejs搭建本地http服务器教程
2017/03/13 NodeJs
ionic中的$ionicPlatform.ready事件中的通用设置
2017/06/11 Javascript
WdatePicker.js时间日期插件的使用方法
2017/07/26 Javascript
Angular4学习笔记之准备和环境搭建项目
2017/08/01 Javascript
Vue打包后出现一些map文件的解决方法
2018/02/13 Javascript
JavaScript控制浏览器全屏显示简单示例
2018/07/05 Javascript
Vue.use()在new Vue() 之前使用的原因浅析
2019/08/26 Javascript
vant时间控件使用方法详解
2020/12/24 Javascript
[48:12]Secret vs Optic Supermajor 胜者组 BO3 第三场 6.4
2018/06/05 DOTA
[52:07]完美世界DOTA2联赛PWL S3 LBZS vs access 第二场 12.10
2020/12/13 DOTA
python 输出一个两行字符的变量
2009/02/05 Python
python 用下标截取字符串的实例
2018/12/25 Python
Python面向对象类编写细节分析【类,方法,继承,超类,接口等】
2019/01/05 Python
Pytorch基本变量类型FloatTensor与Variable用法
2020/01/08 Python
CSS3实现菜单悬停效果
2020/11/17 HTML / CSS
Linux面试经常问的文件系统操作命令
2015/11/05 面试题
合同专员岗位职责
2013/12/18 职场文书
学习2014年全国两会心得体会
2014/03/12 职场文书
计算机多媒体专业自荐信
2014/07/04 职场文书
七夕情人节问候语
2015/11/11 职场文书
班干部竞选演讲稿(精选5篇)
2019/09/24 职场文书
Windows server 2012 NTP时间同步的实现
2022/06/25 Servers