Python爬取附近餐馆信息代码示例


Posted in Python onDecember 09, 2017

本代码主要实现抓取大众点评网中关村附近的餐馆有哪些,具体如下:

import urllib.request 
import re 

def fetchFood(url): 
  # 模拟使用浏览器浏览大众点评的方式浏览大众点评 
  headers = {'User-Agent', 
        'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'} 
  opener = urllib.request.build_opener() 
  opener.addheaders = [headers] 
  data = opener.open(url).read() 
  data = data.decode('utf') 
   print('================================抓取的页面数据=======================================') 
  print(data)   # 打印抓取的页面 
   print('================================获取的餐馆信息====================================') 
  foodNameSet = set(re.compile(r'<img title="(.*?)"', re.DOTALL).findall(data)) 
  number = 0 
  for i in foodNameSet: 
    number = number + 1 
    print("第%d个餐馆: %s" % (number, i)) 
foodUrl = "http://www.dianping.com/search/category/2/10/r1488" 
fetchFood(foodUrl)

输出结果:

"D:\ProgramFiles\python\python.exe"D:/zhangzh/program/MyGitHub/python3-webapp-demo/www/dzdp.py 
================================抓取的页面数据======================================= 
<!DOCTYPEhtml> 
<html> 
<head> 
<metacharset="UTF-8"/> 
<metahttp-equiv="X-UA-Compatible"content="IE=edge"/> 
<script>(function(n){vare;e="//catdot.dianping.com/broker-service/api/js",n.onerror=function(n,o,r){vari=encodeURIComponent,t=+newDate();(newImage).src=e+"?error="+i(n)+"&file="+i(o)+"&line="+i(r)+"×tamp="+t}})(window);</script> 
<title>北京中关村美食-大众点评网</title> 
......此处省略 
<liclass=""> 
<divclass="pic"> 
<atarget="_blank"href="/shop/33562041" rel="external nofollow" rel="external nofollow" rel="external nofollow" title=""> 
<imgtitle="渝是乎(中关村店)"alt="渝是乎(中关村店)"data-src="http://p0.meituan.net/ugcpic/023ff4be1a239be5b7f13ac328bc6c5d%40249w_249h_0e_1l%7Cwatermark%3D1%26%26r%3D1%26p%3D9%26x%3D2%26y%3D2%26relative%3D1%26o%3D20"/> 
</a> 
</div> 
<divclass="txt"> 
<divclass="tit"> 
<aonclick="document.hippo.ext({cl_i:10,query_id:'4ab097b5-d3b6-441b-a684-8b58c0704567'}).mv('cl_to_s',33562041); 
"data-hippo-type="shop"title="渝是乎(中关村店)"target="_blank"href="/shop/33562041" rel="external nofollow" rel="external nofollow" rel="external nofollow" > 
<h4>渝是乎(中关村店)</h4> 
</a> 
<divclass="promo-icon"> 
<atarget="_blank"href="/shop/33562041#waimai" rel="external nofollow"  
class="iout"title="本店支持在线下单,足不出户,外送到家!"></a> 
</div> 
<atarget="_blank"href="/search/branch/2/0_33562041/g0" rel="external nofollow"  
module="list-branch" 
class="shop-branch">分店</a> 
</div> 
<divclass="comment"> 
<spanclass="sml-rank-starssml-str50"title="五星商户"></span> 
<ahref="/shop/33562041#comment" rel="external nofollow" class="review-num"target="_blank"module="list-readreview" 
> 
<b>1536</b> 
条点评</a> 
<emclass="sep">|</em> 
<ahref="/shop/33562041" rel="external nofollow" rel="external nofollow" rel="external nofollow" class="mean-price"target="_blank"> 
人均 
<b>¥42</b> 
</span> 
</a> 
</div> 
<divclass="tag-addr"> 
<ahref="/search/category/2/10/g102" rel="external nofollow" ><spanclass="tag">川菜</span></a> 
<emclass="sep">|</em> 
<ahref="/search/category/2/0/r1488" rel="external nofollow" ><spanclass="tag">中关村</span></a> 
<spanclass="addr">榆树林1号</span> 
</div> 
<spanclass="comment-list"> 
<span>口味<b>9.1</b></span> 
<span>环境<b>8.7</b></span> 
<span>服务<b>8.3</b></span> 
</span> 
</div> 
<divclass="svr-info"> 
......此处省略 
</script> 
</body></html> 
================================获取的餐馆信息==================================== 
第1个餐馆:重八牛府(之初入江湖店) 
第2个餐馆:纽约客美式餐厅(新中关店) 
第3个餐馆:Chatuchak加都加曼谷潮流甜品 
第4个餐馆:新净雅烹小鲜 
第5个餐馆:那家小馆(中关村店) 
第6个餐馆:谷得一 
第7个餐馆:唐廊.朴禅(当代商城店) 
第8个餐馆:小福楼餐厅 
第9个餐馆:食宝街 
第10个餐馆:渝是乎(中关村店) 
第11个餐馆:品咖啡 
第12个餐馆:小吊梨汤(融科店) 
第13个餐馆:鱼八斗老麻水煮鱼(酸菜鱼) 
第14个餐馆:鳗鳗的爱(新中关购物中心店) 
第15个餐馆:速度牛排 
Processfinishedwithexitcode0

总结

以上就是本文关于Python爬取附近餐馆信息代码示例的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:

如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
ptyhon实现sitemap生成示例
Mar 30 Python
scrapy自定义pipeline类实现将采集数据保存到mongodb的方法
Apr 16 Python
python实现图片变亮或者变暗的方法
Jun 01 Python
Python实现处理管道的方法
Jun 04 Python
python删除特定文件的方法
Jul 30 Python
Python实现求笛卡尔乘积的方法
Sep 16 Python
对pytorch网络层结构的数组化详解
Dec 08 Python
python 获取页面表格数据存放到csv中的方法
Dec 26 Python
通过python的matplotlib包将Tensorflow数据进行可视化的方法
Jan 09 Python
Python安装与基本数据类型教程详解
May 29 Python
Python求区间正整数内所有素数之和的方法实例
Oct 13 Python
Python爬虫爬取有道实现翻译功能
Nov 27 Python
Python的地形三维可视化Matplotlib和gdal使用实例
Dec 09 #Python
python登录并爬取淘宝信息代码示例
Dec 09 #Python
Python实现读取txt文件并画三维图简单代码示例
Dec 09 #Python
Python排序搜索基本算法之选择排序实例分析
Dec 09 #Python
Python排序搜索基本算法之冒泡排序实例分析
Dec 09 #Python
Python排序搜索基本算法之希尔排序实例分析
Dec 09 #Python
Python爬取当当、京东、亚马逊图书信息代码实例
Dec 09 #Python
You might like
全国FM电台频率大全 - 5 内蒙古自治区
2020/03/11 无线电
PHP的可变变量名的使用方法分享
2012/02/05 PHP
javascript修改表格背景色实例代码分享
2013/12/10 Javascript
jquery改变disabled的boolean状态的三种方法
2013/12/13 Javascript
nodejs事件的监听与触发的理解分析
2015/02/12 NodeJs
JS中frameset框架弹出层实例代码
2016/04/01 Javascript
javascript宿主对象之window.navigator详解
2016/09/07 Javascript
jQuery实现表格文本框淡入更改值后淡出效果
2016/09/27 Javascript
微信小程序-拍照或选择图片并上传文件
2017/01/06 Javascript
jQuery.cookie.js实现记录最近浏览过的商品功能示例
2017/01/23 Javascript
vue实现todolist单页面应用
2017/04/11 Javascript
Nodejs之http的表单提交
2017/07/07 NodeJs
vue组件实现弹出框点击显示隐藏效果
2020/10/26 Javascript
json数据格式常见操作示例
2019/06/13 Javascript
vue实现跳转接口push 转场动画示例
2019/11/01 Javascript
vue实现图片上传到后台
2020/06/29 Javascript
JS实现斐波那契数列的五种方式(小结)
2020/09/09 Javascript
python求素数示例分享
2014/02/16 Python
python采用django框架实现支付宝即时到帐接口
2016/05/17 Python
Python中字符串的处理技巧分享
2016/09/17 Python
基于Python代码编辑器的选用(详解)
2017/09/13 Python
利用python对Excel中的特定数据提取并写入新表的方法
2018/06/14 Python
完美解决Python matplotlib绘图时汉字显示不正常的问题
2019/01/29 Python
Python 处理日期时间的Arrow库使用
2020/08/18 Python
英国豪华针织品牌John Smedley的在线销售商:The Outlet by John Smedley
2018/04/08 全球购物
LivingSocial爱尔兰:爱尔兰本地优惠
2018/08/10 全球购物
COS美国官网:知名服装品牌
2019/04/08 全球购物
拓展训练激励口号
2014/06/17 职场文书
2014年国庆节演讲稿精选范文1500字
2014/09/25 职场文书
小学重阳节活动总结
2015/03/24 职场文书
2015学校图书管理员工作总结
2015/05/11 职场文书
公司员工手册范本
2015/05/14 职场文书
烈士陵园扫墓感想
2015/08/07 职场文书
vue Element-ui表格实现树形结构表格
2021/06/07 Vue.js
Nginx location 和 proxy_pass路径配置问题小结
2021/09/04 Servers
CSS浮动引起的高度塌陷问题
2022/08/05 HTML / CSS