python 爬虫爬取京东ps4售卖情况


Posted in Python onDecember 18, 2020

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 赵路仓
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("开始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取结果

python 爬虫爬取京东ps4售卖情况

以上就是python 爬虫爬取某东ps4售卖情况的详细内容,更多关于python 爬虫的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python中的一些类型转换函数小结
Feb 10 Python
在Python中调用ggplot的三种方法
Apr 08 Python
Python给定一个句子倒序输出单词以及字母的方法
Dec 20 Python
python实现单目标、多目标、多尺度、自定义特征的KCF跟踪算法(实例代码)
Jan 08 Python
如何基于pythonnet调用halcon脚本
Jan 20 Python
keras获得model中某一层的某一个Tensor的输出维度教程
Jan 24 Python
python pprint模块中print()和pprint()两者的区别
Feb 10 Python
Jupyter notebook 远程配置及SSL加密教程
Apr 14 Python
Python实现CAN报文转换工具教程
May 05 Python
Python几种常见算法汇总
Jun 02 Python
协程Python 中实现多任务耗资源最小的方式
Oct 19 Python
python 怎样进行内存管理
Nov 10 Python
python实现视频压缩功能
Dec 18 #Python
MoviePy常用剪辑类及Python视频剪辑自动化
Dec 18 #Python
python 实现全球IP归属地查询工具
Dec 18 #Python
MoviePy简介及Python视频剪辑自动化
Dec 18 #Python
Python非单向递归函数如何返回全部结果
Dec 18 #Python
python复合条件下的字典排序
Dec 18 #Python
python 监控服务器是否有人远程登录(详细思路+代码)
Dec 18 #Python
You might like
德生1994机评
2021/03/02 无线电
php内核解析:PHP中的哈希表
2014/01/30 PHP
php stripslashes和addslashes的区别
2014/02/03 PHP
分享php代码将360浏览器导出的favdb的sqlite数据库文件转换为html
2015/12/09 PHP
php $_SESSION会员登录实例分享
2021/01/19 PHP
使用php实现网站验证码功能【推荐】
2017/02/09 PHP
PHP 代码简洁之道(小结)
2019/10/16 PHP
JavaScript全排列的六种算法 具体实现
2013/06/29 Javascript
JS文本框追加多个下拉框的值的简单实例
2013/07/12 Javascript
js实现字符串和数组之间相互转换操作
2016/01/12 Javascript
require简单实现单页应用程序(SPA)
2016/07/12 Javascript
jQuery元素属性操作实例(设置、获取及删除元素属性)
2016/09/08 Javascript
JS访问DOM节点方法详解
2016/11/29 Javascript
一个例子轻松学会Vue.js
2017/01/02 Javascript
JavaScript利用闭包实现模块化
2017/01/13 Javascript
javaScript嗅探执行神器-sniffer.js
2017/02/14 Javascript
jQuery快速高效制作网页交互特效
2017/02/24 Javascript
详解基于Vue-cli搭建的项目如何和后台交互
2018/06/29 Javascript
Vue Router中应用中间件的方法
2020/08/06 Javascript
利用 Chrome Dev Tools 进行页面性能分析的步骤说明(前端性能优化)
2021/02/24 Javascript
python fabric使用笔记
2015/05/09 Python
解决DataFrame排序sort的问题
2018/06/07 Python
朴素贝叶斯分类算法原理与Python实现与使用方法案例
2018/06/26 Python
Django REST Framework序列化外键获取外键的值方法
2019/07/26 Python
pywinauto自动化操作记事本
2019/08/26 Python
Python 日期的转换及计算的具体使用详解
2020/01/16 Python
Python自动化测试笔试面试题精选
2020/03/12 Python
tensorflow与numpy的版本兼容性问题的解决
2021/01/08 Python
基于Html5 canvas实现裁剪图片和马赛克功能及又拍云上传图片 功能
2019/07/09 HTML / CSS
天猫国际进口超市直营:官方直采,一站购齐
2017/12/11 全球购物
师范生自我鉴定
2014/03/20 职场文书
群众路线个人自我剖析材料
2014/10/07 职场文书
2014年派出所工作总结
2014/11/21 职场文书
2014社区健康教育工作总结
2014/12/16 职场文书
周恩来的四个昼夜观后感
2015/06/03 职场文书
Java实现房屋出租系统详解
2021/10/05 Java/Android