python 爬虫爬取京东ps4售卖情况


Posted in Python onDecember 18, 2020

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 赵路仓
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("开始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取结果

python 爬虫爬取京东ps4售卖情况

以上就是python 爬虫爬取某东ps4售卖情况的详细内容,更多关于python 爬虫的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python批量修改文件后缀示例代码分享
Dec 24 Python
Python实现读取目录所有文件的文件名并保存到txt文件代码
Nov 22 Python
python通过smpt发送邮件的方法
Apr 30 Python
Python实现读取SQLServer数据并插入到MongoDB数据库的方法示例
Jun 09 Python
Selenium的使用详解
Oct 19 Python
python生成带有表格的图片实例
Feb 03 Python
python将类似json的数据存储到MySQL中的实例
Jul 12 Python
tensorflow实现读取模型中保存的值 tf.train.NewCheckpointReader
Feb 10 Python
Tensorflow 模型转换 .pb convert to .lite实例
Feb 12 Python
Selenium使用Chrome模拟手机浏览器方法解析
Apr 10 Python
Python selenium模拟手动操作实现无人值守刷积分功能
May 13 Python
Python+logging输出到屏幕将log日志写入文件
Nov 11 Python
python实现视频压缩功能
Dec 18 #Python
MoviePy常用剪辑类及Python视频剪辑自动化
Dec 18 #Python
python 实现全球IP归属地查询工具
Dec 18 #Python
MoviePy简介及Python视频剪辑自动化
Dec 18 #Python
Python非单向递归函数如何返回全部结果
Dec 18 #Python
python复合条件下的字典排序
Dec 18 #Python
python 监控服务器是否有人远程登录(详细思路+代码)
Dec 18 #Python
You might like
深入mysql_fetch_row()与mysql_fetch_array()的区别详解
2013/06/05 PHP
php的memcache类分享(memcache队列)
2014/03/26 PHP
ThinkPHP之R方法实例详解
2014/06/20 PHP
php计算两个日期相差天数的方法
2015/03/14 PHP
php实现过滤字符串中的中文和数字实例
2015/07/29 PHP
PHP swoole和redis异步任务实现方法分析
2019/08/12 PHP
JQuery困惑—包装集 DOM节点
2009/10/16 Javascript
Javascript面向对象设计一 工厂模式
2011/12/20 Javascript
解析页面加载与js函数的执行 onload or ready
2013/12/12 Javascript
JS使用replace()方法和正则表达式进行字符串的搜索与替换实例
2014/04/10 Javascript
jquery中checkbox全选失效的解决方法
2014/12/26 Javascript
jQuery实现滚动鼠标放大缩小图片的方法(附demo源码下载)
2016/03/05 Javascript
bootstrap布局中input输入框右侧图标点击功能
2016/05/16 Javascript
浅析Javascript中bind()方法的使用与实现
2016/05/30 Javascript
jquery使用on绑定a标签无效 只能用live解决
2016/06/02 Javascript
jQuery操作dom实现弹出页面遮罩层(web端和移动端阻止遮罩层的滑动)
2016/08/25 Javascript
jQuery插件JWPlayer视频播放器用法实例分析
2017/01/11 Javascript
Vue resource三种请求格式和万能测试地址
2018/09/26 Javascript
大转盘抽奖小程序版 转盘抽奖网页版
2020/04/16 Javascript
mpvue实现左侧导航与右侧内容的联动
2019/10/21 Javascript
[01:29:46]DOTA2上海特级锦标赛C组资格赛#1 OG VS LGD第二局
2016/02/27 DOTA
对Python中list的倒序索引和切片实例讲解
2018/11/15 Python
python 获取url中的参数列表实例
2018/12/18 Python
python getpass模块用法及实例详解
2019/10/07 Python
Python爬虫爬取微博热搜保存为 Markdown 文件的源码
2021/02/22 Python
英语专业大学生求职简历的自我评价
2013/10/18 职场文书
房地产管理毕业生自荐信
2013/11/04 职场文书
小学生期末自我鉴定
2014/01/19 职场文书
个人充满哲理的自我评价
2014/02/20 职场文书
初三学生个人自我评定
2014/04/06 职场文书
校园广播稿精选
2014/10/01 职场文书
2015年语文教师工作总结
2015/05/25 职场文书
冰雪公主观后感
2015/06/16 职场文书
运动员入场前导词
2015/07/20 职场文书
一封真诚的自荐信帮你赢得机会
2019/05/07 职场文书
详细介绍Next.js脚手架完整搭建封装
2022/04/26 Javascript