python 爬虫爬取京东ps4售卖情况


Posted in Python onDecember 18, 2020

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 赵路仓
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("开始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取结果

python 爬虫爬取京东ps4售卖情况

以上就是python 爬虫爬取某东ps4售卖情况的详细内容,更多关于python 爬虫的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
详解Python中的array数组模块相关使用
Jul 05 Python
python实现简单爬虫功能的示例
Oct 24 Python
django admin 后台实现三级联动的示例代码
Jun 22 Python
深入浅析Python获取对象信息的函数type()、isinstance()、dir()
Sep 17 Python
Python爬取成语接龙类网站
Oct 19 Python
对pyqt5多线程正确的开启姿势详解
Jun 14 Python
Flask使用Pyecharts在单个页面展示多个图表的方法
Aug 05 Python
基于Python2、Python3中reload()的不同用法介绍
Aug 12 Python
Python字符串hashlib加密模块使用案例
Mar 10 Python
Python实现AES加密,解密的两种方法
Oct 03 Python
Python通过Schema实现数据验证方式
Nov 12 Python
最新pycharm安装教程
Nov 18 Python
python实现视频压缩功能
Dec 18 #Python
MoviePy常用剪辑类及Python视频剪辑自动化
Dec 18 #Python
python 实现全球IP归属地查询工具
Dec 18 #Python
MoviePy简介及Python视频剪辑自动化
Dec 18 #Python
Python非单向递归函数如何返回全部结果
Dec 18 #Python
python复合条件下的字典排序
Dec 18 #Python
python 监控服务器是否有人远程登录(详细思路+代码)
Dec 18 #Python
You might like
jQuery+php实现ajax文件即时上传的详解
2013/06/17 PHP
thinkPHP实现递归循环栏目并按照树形结构无限极输出的方法
2016/05/19 PHP
PHP将身份证正反面两张照片合成一张图片的代码
2017/04/08 PHP
php7 图形用户界面GUI 开发示例
2020/02/22 PHP
JavaScript 轻松搞定快捷留言功能 只需一行代码
2010/04/01 Javascript
js面向对象设计用{}好还是function(){}好(构造函数)
2011/10/23 Javascript
javascript检测浏览器flash版本的实现代码
2011/12/06 Javascript
jQuery 在光标定位的地方插入文字的插件
2012/05/10 Javascript
浅谈JavaScript之事件绑定
2013/07/08 Javascript
js中的时间转换—毫秒转换成日期时间的示例代码
2014/01/26 Javascript
纯JS实现根据CSS的class选择DOM
2014/03/22 Javascript
jQuery照片伸缩效果不影响其他元素的布局
2014/05/09 Javascript
抛弃Nginx使用nodejs做反向代理服务器
2014/07/17 NodeJs
JS解析XML文件和XML字符串详解
2015/04/17 Javascript
javascript原型模式用法实例详解
2015/06/04 Javascript
jQuery实现大转盘抽奖活动仿QQ音乐代码分享
2015/08/21 Javascript
JavaScript 常见安全漏洞和自动化检测技术
2015/08/21 Javascript
AngularJS实现Model缓存的方式
2016/02/03 Javascript
原生JS版和jquery版实现checkbox的全选/全不选/点选/行内点选(Mr.Think)
2016/10/29 Javascript
AngularJS使用ng-inlude指令加载页面失败的原因与解决方法
2017/01/19 Javascript
jquery.tableSort.js表格排序插件使用方法详解
2020/08/12 Javascript
解决angular双向绑定无效果,ng-model不能正常显示的问题
2018/10/02 Javascript
Vue中函数防抖节流的理解及应用实现
2020/04/24 Javascript
JavaScript实现缓动动画
2020/11/25 Javascript
使用Python构建Hopfield网络的教程
2015/04/14 Python
python获取局域网占带宽最大3个ip的方法
2015/07/09 Python
Python单例模式实例详解
2017/03/01 Python
让Python更加充分的使用Sqlite3
2017/12/11 Python
python 返回列表中某个值的索引方法
2018/11/07 Python
对pandas读取中文unicode的csv和添加行标题的方法详解
2018/12/12 Python
澳大利亚最超值的自行车之家:Reid Cycles
2019/03/24 全球购物
护士实习鉴定范文
2013/12/22 职场文书
低碳环保倡议书
2014/04/14 职场文书
代领报检证委托书范本
2014/10/11 职场文书
世界无敌的ICOM IC-R9500宽频接收机
2022/03/25 无线电
《仙剑客栈2》第一弹正式宣传片公开 年内发售
2022/04/07 其他游戏