python 爬虫爬取京东ps4售卖情况


Posted in Python onDecember 18, 2020

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 赵路仓
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("开始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取结果

python 爬虫爬取京东ps4售卖情况

以上就是python 爬虫爬取某东ps4售卖情况的详细内容,更多关于python 爬虫的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python中pycurl库的用法实例
Sep 30 Python
python任务调度实例分析
May 19 Python
Django学习笔记之Class-Based-View
Feb 15 Python
Django 接收Post请求数据,并保存到数据库的实现方法
Jul 12 Python
使用python制作一个解压缩软件
Nov 13 Python
Python3.7 基于 pycryptodome 的AES加密解密、RSA加密解密、加签验签
Dec 04 Python
Django-xadmin后台导入json数据及后台显示信息图标和主题更改方式
Mar 11 Python
实例讲解Python 迭代器与生成器
Jul 08 Python
python实现简易名片管理系统
Apr 11 Python
如何利用Matlab制作一款真正的拼图小游戏
May 11 Python
Pandas 稀疏数据结构的实现
Jul 25 Python
Python之Matplotlib绘制热力图和面积图
Apr 13 Python
python实现视频压缩功能
Dec 18 #Python
MoviePy常用剪辑类及Python视频剪辑自动化
Dec 18 #Python
python 实现全球IP归属地查询工具
Dec 18 #Python
MoviePy简介及Python视频剪辑自动化
Dec 18 #Python
Python非单向递归函数如何返回全部结果
Dec 18 #Python
python复合条件下的字典排序
Dec 18 #Python
python 监控服务器是否有人远程登录(详细思路+代码)
Dec 18 #Python
You might like
模拟SQLSERVER的两个函数:dateadd(),datediff()
2006/10/09 PHP
PHP 5.5 创建和验证哈希最简单的方法详解
2013/11/07 PHP
PHP的password_hash()使用实例
2014/03/17 PHP
Windows Live的@live.com域名注册漏洞 利用代码
2006/12/27 Javascript
基于jquery的滑动样例代码
2010/11/20 Javascript
《JavaScript高级程序设计》阅读笔记(三) ECMAScript中的引用类型
2012/02/27 Javascript
js实现仿MSN带关闭功能的右下角弹窗代码
2015/09/04 Javascript
网页前端登录js按Enter回车键实现登陆的两种方法
2016/05/10 Javascript
js提示框替代系统alert,自动关闭alert对话框的实现方法
2016/11/07 Javascript
基于nodejs 的多页面爬虫实例代码
2017/05/31 NodeJs
Node.js实现mysql连接池使用事务自动回收连接的方法示例
2018/02/03 Javascript
p5.js入门教程和基本形状绘制
2018/03/15 Javascript
webpack公共组件引用路径简化小技巧
2018/06/15 Javascript
vue中axios的封装问题(简易版拦截,get,post)
2018/06/15 Javascript
Vue表单demo v-model双向绑定问题
2018/06/29 Javascript
Vue props 单向数据流的实现
2018/11/06 Javascript
vue项目中axios请求网络接口封装的示例代码
2018/12/18 Javascript
5分钟教你用nodeJS手写一个mock数据服务器的方法
2019/09/10 NodeJs
node.js使用zlib模块进行数据压缩和解压操作示例
2020/02/12 Javascript
[02:51]DOTA2英雄基础教程 风暴之灵
2013/12/23 DOTA
wxPython中文教程入门实例
2014/06/09 Python
Python Flask基础教程示例代码
2018/02/07 Python
Python注释、分支结构、循环结构、伪“选择结构”用法实例分析
2020/01/09 Python
消防安全检查制度
2014/02/04 职场文书
军训自我鉴定200字
2014/02/13 职场文书
《狼》教学反思
2014/03/02 职场文书
会计电算化毕业生自荐信
2014/03/03 职场文书
吃空饷专项治理工作实施方案
2014/03/04 职场文书
2014客服代表实习自我鉴定
2014/09/18 职场文书
综合素质评价个性发展自我评价
2015/03/06 职场文书
学习与创新自我评价
2015/03/09 职场文书
不同意离婚答辩状
2015/05/22 职场文书
小学体育组工作总结
2015/08/13 职场文书
微信小程序scroll-view不能左右滑动问题的解决方法
2021/07/09 Javascript
排查Tomcat进程假死的问题
2022/05/06 Servers
Mysql数据库group by原理详解
2022/07/07 MySQL