python 爬虫爬取京东ps4售卖情况


Posted in Python onDecember 18, 2020

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 赵路仓
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("开始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取结果

python 爬虫爬取京东ps4售卖情况

以上就是python 爬虫爬取某东ps4售卖情况的详细内容,更多关于python 爬虫的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
简单介绍利用TK在Python下进行GUI编程的教程
Apr 13 Python
在服务器端实现无间断部署Python应用的教程
Apr 16 Python
python写日志封装类实例
Jun 28 Python
关于python的bottle框架跨域请求报错问题的处理方法
Mar 19 Python
python实现简易内存监控
Jun 21 Python
从0开始的Python学习016异常
Apr 08 Python
Python解析json时提示“string indices must be integers”问题解决方法
Jul 31 Python
python3连接MySQL8.0的两种方式
Feb 17 Python
Python AutoCAD 系统设置的实现方法
Apr 01 Python
python shapely.geometry.polygon任意两个四边形的IOU计算实例
Apr 12 Python
正确的理解和使用Django信号(Signals)
Apr 14 Python
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 Python
python实现视频压缩功能
Dec 18 #Python
MoviePy常用剪辑类及Python视频剪辑自动化
Dec 18 #Python
python 实现全球IP归属地查询工具
Dec 18 #Python
MoviePy简介及Python视频剪辑自动化
Dec 18 #Python
Python非单向递归函数如何返回全部结果
Dec 18 #Python
python复合条件下的字典排序
Dec 18 #Python
python 监控服务器是否有人远程登录(详细思路+代码)
Dec 18 #Python
You might like
将数组写入txt文件 var_export
2009/04/21 PHP
PHP测试程序运行时间的类
2012/02/05 PHP
域名和cookie问题(域名后缀)
2012/10/10 PHP
thinkphp5 + ajax 使用formdata提交数据(包括文件上传) 后台返回json完整实例
2020/03/02 PHP
json跟xml的对比分析
2008/06/10 Javascript
jquery+json实现的搜索加分页效果
2010/03/31 Javascript
jquery foreach使用示例
2013/09/12 Javascript
jQuery插件Slider Revolution实现响应动画滑动图片切换效果
2015/06/05 Javascript
jQuery+CSS实现的网页二级下滑菜单效果
2015/08/25 Javascript
简单解析JavaScript中的__proto__属性
2016/05/10 Javascript
js 实现获取name 相同的页面元素并循环遍历的方法
2017/02/14 Javascript
详解JavaScript 中 if / if...else...替换方式
2018/07/15 Javascript
JS实现移动端在线签协议功能
2019/08/22 Javascript
Vue通过配置WebSocket并实现群聊功能
2019/12/31 Javascript
如何在node环境实现“get数据解析”代码实例
2020/07/03 Javascript
vue-simple-uploader上传成功之后的response获取代码
2020/09/07 Javascript
在vue中使用Echarts画曲线图的示例
2020/10/03 Javascript
[02:36]DOTA2英雄基础教程 一击致命幻影刺客
2013/12/06 DOTA
[01:02:00]DOTA2-DPC中国联赛 正赛 Elephant vs IG BO3 第三场 1月24日
2021/03/11 DOTA
Python httplib,smtplib使用方法
2008/09/06 Python
wxPython使用系统剪切板的方法
2015/06/16 Python
Python文件操作基本流程代码实例
2017/12/11 Python
pandas按若干个列的组合条件筛选数据的方法
2018/04/11 Python
Django 框架模型操作入门教程
2019/11/05 Python
Python 自由定制表格的实现示例
2020/03/20 Python
美体小铺波兰官方网站:The Body Shop波兰
2019/09/03 全球购物
教学器材管理制度
2014/01/26 职场文书
汇源肾宝广告词
2014/03/20 职场文书
我爱我校演讲稿
2014/05/21 职场文书
党的群众路线教育实践活动通讯稿
2014/09/10 职场文书
2015年机械设备管理工作总结
2015/05/04 职场文书
消夏晚会主持词
2015/06/30 职场文书
公司业务员管理制度
2015/08/05 职场文书
简短的36句中秋节祝福信息语句
2019/09/09 职场文书
《家世》读后感:看家训的力量
2019/12/30 职场文书
Python列表删除重复元素与图像相似度判断及删除实例代码
2021/05/07 Python