python爬虫爬取淘宝商品信息


Posted in Python onFebruary 23, 2018

本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图:

python爬虫爬取淘宝商品信息

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python设计模式之单例模式实例
Apr 26 Python
python中List的sort方法指南
Sep 01 Python
Python解析网页源代码中的115网盘链接实例
Sep 30 Python
详解Python中for循环的使用
Apr 14 Python
Python实现的微信公众号群发图片与文本消息功能实例详解
Jun 30 Python
python DataFrame获取行数、列数、索引及第几行第几列的值方法
Apr 08 Python
Anaconda下配置python+opencv+contribx的实例讲解
Aug 06 Python
Python实现定时执行任务的三种方式简单示例
Mar 30 Python
pandas对dataFrame中某一个列的数据进行处理的方法
Jul 08 Python
PowerBI和Python关于数据分析的对比
Jul 11 Python
python获得命令行输入的参数的两种方式
Nov 02 Python
分享提高 Python 代码的可读性的技巧
Mar 03 Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
You might like
phpmyadmin显示utf8_general_ci中文乱码的问题终级篇
2013/04/08 PHP
基于PHP导出Excel的小经验 完美解决乱码问题
2013/06/10 PHP
php函数实现判断是否移动端访问
2015/03/03 PHP
PHP CodeIgniter框架的工作原理研究
2015/03/30 PHP
PHP实现递归复制整个文件夹的类实例
2015/08/03 PHP
php+ajax 实现输入读取数据库显示匹配信息
2015/10/08 PHP
使用Composer安装Yii框架的方法
2016/03/15 PHP
jQuery选择没有colspan属性的td的代码
2010/07/06 Javascript
使用jQuery全局事件ajaxStart为特定请求实现提示效果的代码
2010/12/30 Javascript
jquery ui dialog实现弹窗特效的思路及代码
2013/08/03 Javascript
js时间戳格式化成日期格式的多种方法
2013/11/11 Javascript
JavaScript访问CSS属性的几种方式介绍
2014/07/21 Javascript
JS插件overlib用法实例详解
2015/12/26 Javascript
Three.js学习之Lamber材质和Phong材质
2016/08/04 Javascript
微信小程序 window_x64环境搭建
2016/09/30 Javascript
AngularJS的ng Http Request与response格式转换方法
2016/11/07 Javascript
React props和state属性的具体使用方法
2018/04/12 Javascript
vue中的数据绑定原理的实现
2018/07/02 Javascript
vue项目首屏打开速度慢的解决方法
2019/03/31 Javascript
京东优选小程序的实现代码示例
2020/02/25 Javascript
JavaScript实现简单动态表格
2020/12/02 Javascript
python执行shell获取硬件参数写入mysql的方法
2014/12/29 Python
python使用xmlrpclib模块实现对百度google的ping功能
2015/06/02 Python
简单的Apache+FastCGI+Django配置指南
2015/07/22 Python
python3 模拟登录v2ex实例讲解
2017/07/13 Python
python 字典中文key处理,读取,比较方法
2018/07/06 Python
Python学习笔记之变量、自定义函数用法示例
2019/05/28 Python
Python如何实现转换URL详解
2019/07/02 Python
杭州时比特电子有限公司SQL
2013/08/22 面试题
留学自荐信
2013/10/10 职场文书
小区门卫值班制度
2014/01/24 职场文书
《开国大典》教学反思
2014/04/19 职场文书
图书馆标语
2014/06/19 职场文书
解除同居协议书
2015/01/29 职场文书
班主任高考寄语
2015/02/26 职场文书
学校百日安全活动总结
2015/05/07 职场文书