Python+树莓派+YOLO打造一款人工智能照相机


Posted in Python onJanuary 02, 2018

不久之前,亚马逊刚刚推出了DeepLens 。这是一款专门面向开发人员的全球首个支持深度学习的摄像机,它所使用的机器学习算法不仅可以检测物体活动和面部表情,而且还可以检测类似弹吉他等复杂的活动。虽然DeepLens还未正式上市,但智能摄像机的概念已经诞生了。

Python+树莓派+YOLO打造一款人工智能照相机 

今天,我们将自己动手打造出一款基于深度学习的照相机,当小鸟出现在摄像头画面中时,它将能检测到小鸟并自动进行拍照。最终成品所拍摄的画面如下所示:

Python+树莓派+YOLO打造一款人工智能照相机 

相机不傻,它可以很机智

我们不打算将一个深度学习模块整合到相机中,相反,我们准备将树莓派“挂钩”到摄像头上,然后通过WiFi来发送照片。本着“一切从简”(穷)为核心出发,我们今天只打算搞一个跟DeepLens类似的概念原型,感兴趣的同学可以自己动手尝试一下。

接下来,我们将使用Python编写一个Web服务器,树莓派将使用这个Web服务器来向计算机发送照片,或进行行为推断和图像检测。

Python+树莓派+YOLO打造一款人工智能照相机 

我们这里所使用的计算机其处理能力会更强,它会使用一种名叫 YOLO 的神经网络架构来检测输入的图像画面,并判断小鸟是否出现在了摄像头画面内。

我们得先从YOLO架构开始,因为它是目前速度最快的检测模型之一。该模型专门给Tensorflow(谷歌基于DistBelief进行研发的第二代人工智能学习系统)留了一个接口,所以我们可以轻松地在不同的平台上安装和运行这个模型。友情提示,如果你使用的是我们本文所使用的迷你模型,你还可以用CPU来进行检测,而不只是依赖于价格昂贵的GPU。

接下来回到我们的概念原型上… 如果像框内检测到了小鸟,那我们就保存图片并进行下一步分析。

检测与拍照

Python+树莓派+YOLO打造一款人工智能照相机 

正如我们所说的,DeepLens的拍照功能是整合在计算机里的,所以它可以直接使用板载计算能力来进行基准检测,并确定图像是否符合我们的标准。

但是像树莓派这样的东西,我们其实并不需要使用它的计算能力来进行实时计算。因此,我们准备使用另一台计算机来推断出现在图像中的内容。

我使用的是一台简单的Linux计算机,它带有一个摄像头以及WiFi无线网卡( 树莓派3 + 摄像头 ),而这个简单的设备将作为我的深度学习机器并进行图像推断。对我来说,这是目前最理想的解决方案了,这不仅大大缩减了我的成本,而且还可以让我在台式机上完成所有的计算。

当然了,如果你不想使用树莓派视频照相机的话,你也可以选择在树莓派上安装OpenCV 3来作为方案B,具体的安装方法请参考【这份文档 】。友情提示,安装过程可谓是非常的麻烦!

接下来,我们需要使用Flask来搭建Web服务器,这样我们就可以从摄像头那里获取图像了。这里我使用了 MiguelGrinberg 所开发的网络摄像头服务器代码( Flask视频流框架 ),并创建了一个简单的jpg终端:

#!/usr/bin/envpython
from import lib import import_module
import os
from flask import Flask, render_template, Response
#uncomment below to use Raspberry Pi camera instead
#from camera_pi import Camera
#comment this out if you're not using USB webcam
from camera_opencv import Camera
app =Flask(__name__)
@app.route('/')
def index():
 return "hello world!"
def gen2(camera):
 """Returns a single imageframe"""
 frame = camera.get_frame()
 yield frame
@app.route('/image.jpg')
def image():
 """Returns a single currentimage for the webcam"""
 return Response(gen2(Camera()),mimetype='image/jpeg')
if __name__ == '__main__':
app.run(host='0.0.0.0', threaded=True)

如果你使用的是树莓派视频照相机,请确保没有注释掉上述代码中from camera_pi那一行,然后注释掉from camera_opencv那一行。

你可以直接使用命令python3 app.py或gunicorn来运行服务器,这跟Miguel在文档中写的方法是一样的。如果我们使用了多台计算机来进行图像推断的话,我们还可以利用Miguel所开发的摄像头管理方案来管理摄像头以及计算线程。

当我们启动了树莓派之后,首先需要根据IP地址来判断服务器是否正常工作,然后尝试通过Web浏览器来访问服务器。

URL地址格式类似如下:

http://192.168.1.4:5000/image.jpg

在树莓派中加载Web页面及图像来确定服务器是否正常工作:

Python+树莓派+YOLO打造一款人工智能照相机 

图像导入及推断

既然我们已经设置好了终端来加载摄像头当前的图像内容,我们就可以构建一个脚本来捕捉图像并推断图像中的内容了。

这里我们需要用到request库(一个优秀的Python库,用于从URL地址获取文件资源)以及 Darkflow (YOLO模型基于Tensorflow的实现)。

不幸的是,我们没办法使用pip之类的方法来安装 Darkflow ,所以我们需要克隆整个代码库,然后自己动手完成项目的构建和安装。安装好Darkflow项目之后,我们还需要下载一个YOLO模型。

因为我使用的是速度比较慢的计算机和板载CPU(而不是速度较快的GPU),所以我选择使用YOLO v2迷你网络。当然了,它的功能肯定没有完整的YOLO v2模型的推断准确性高啦!

配置完成之后,我们还需要在计算机中安装Pillow、numpy和OpenCV。最后,我们就可以彻底完成我们的代码,并进行图像检测了。

最终的代码如下所示:

from darkflow.net.build import TFNet
import cv2
from io import BytesIO
import time
import requests
from PIL import Image
import numpy as np
options= {"model": "cfg/tiny-yolo-voc.cfg", "load":"bin/tiny-yolo-voc.weights", "threshold": 0.1}
tfnet= TFNet(options)
birdsSeen= 0
def handleBird():
 pass
whileTrue:
 r =requests.get('http://192.168.1.11:5000/image.jpg') # a bird yo
 curr_img = Image.open(BytesIO(r.content))
 curr_img_cv2 =cv2.cvtColor(np.array(curr_img), cv2.COLOR_RGB2BGR)
 result = tfnet.return_predict(curr_img_cv2)
 print(result)
 for detection in result:
  if detection['label'] == 'bird':
   print("bird detected")
   birdsSeen += 1
   curr_img.save('birds/%i.jpg' %birdsSeen)
 print('running again')
time.sleep(4)

此时,我们不仅可以在命令控制台中查看到树莓派所检测到的内容,而且我们还可以直接在硬盘中查看保存下来的小鸟照片。接下来,我们就可以使用YOLO来标记图片中的小鸟了。

假阳性跟假阴性之间的平衡

我们在代码的options字典中设置了一个threshold键,这个阈值代表的是我们用于检测图像的某种成功率。在测试过程中,我们将其设为了0.1,但是如此低的阈值会给我们带来是更高的假阳性以及误报率。更糟的是,我们所使用的迷你YOLO模型准确率跟完整的YOLO模型相比,差得太多了,但这也是需要考虑的一个平衡因素。

降低阈值意味着我们可以得到更多的模型输出(照片),在我的测试环境中,我阈值设置的比较低,因为我想得到更多的小鸟照片,不过大家可以根据自己的需要来调整阈值参数。

代码开源

跟之前一样,我已经将所有的代码上传到GitHub上了,感兴趣的同学可以自行下载安装【 GitHub传送门 】。

Python 相关文章推荐
在Python中使用模块的教程
Apr 27 Python
Python发送form-data请求及拼接form-data内容的方法
Mar 05 Python
一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
Apr 17 Python
python3.6使用pickle序列化class的方法
Oct 22 Python
python导入模块交叉引用的方法
Jan 19 Python
Python3从零开始搭建一个语音对话机器人的实现
Aug 23 Python
python处理excel绘制雷达图
Oct 18 Python
解决TensorFlow模型恢复报错的问题
Feb 06 Python
Python处理PDF与CDF实例
Feb 26 Python
django 取消csrf限制的实例
Mar 13 Python
python中sklearn的pipeline模块实例详解
May 21 Python
Python 远程开关机的方法
Nov 18 Python
matplotlib绘制动画代码示例
Jan 02 #Python
Python+matplotlib+numpy实现在不同平面的二维条形图
Jan 02 #Python
Python 实现淘宝秒杀的示例代码
Jan 02 #Python
python基于twisted框架编写简单聊天室
Jan 02 #Python
python http接口自动化脚本详解
Jan 02 #Python
详解用python实现简单的遗传算法
Jan 02 #Python
一个Python最简单的接口自动化框架
Jan 02 #Python
You might like
php无限级评论嵌套实现代码
2018/04/18 PHP
PHP实现一维数组与二维数组去重功能示例
2018/05/24 PHP
ThinkPHP5.0多个文件上传后找不到临时文件的修改方法
2018/07/30 PHP
TP5框架实现自定义分页样式的方法示例
2020/04/05 PHP
PHP 99乘法表的几种实现代码
2020/10/13 PHP
繁简字转换功能
2006/07/19 Javascript
一个js写的日历(代码部分网摘)
2009/09/20 Javascript
关于JavaScript与HTML的交互事件
2013/04/12 Javascript
javascript读写XML实现广告轮换(兼容IE、FF)
2013/08/09 Javascript
jQuery实现防止提交按钮被双击的方法
2015/03/24 Javascript
jQuery的层级查找方式分析
2016/06/16 Javascript
微信小程序API—获取定位的详解
2019/04/30 Javascript
深入解析Python中函数的参数与作用域
2016/03/20 Python
Python爬取附近餐馆信息代码示例
2017/12/09 Python
python使用原始套接字发送二层包(链路层帧)的方法
2019/07/22 Python
Python 解决OPEN读文件报错 ,路径以及r的问题
2019/12/19 Python
python路径的写法及目录的获取方式
2019/12/26 Python
Pycharm打开已有项目配置python环境的方法
2020/07/03 Python
13个Pandas实用技巧,助你提高开发效率
2020/08/19 Python
HTML5实现锚点时请使用id取代name
2013/09/06 HTML / CSS
使用phonegap播放音频的实现方法
2017/03/31 HTML / CSS
Space NK美国站:英国高端美妆护肤商城
2017/05/22 全球购物
New Balance法国官方网站:购买鞋子和服装
2019/09/01 全球购物
西雅图的买手店:Totokaelo
2019/10/19 全球购物
NULL是什么,它是怎么定义的
2015/05/09 面试题
感恩节活动策划方案
2014/05/16 职场文书
幼儿教师师德师风演讲稿
2014/08/22 职场文书
党委干部批评与自我批评发言稿
2014/09/28 职场文书
村党支部书记四风问题个人对照检查材料思想汇报
2014/10/06 职场文书
中学生勤俭节约倡议书
2015/04/29 职场文书
2015年学校政教处工作总结
2015/05/26 职场文书
海洋天堂观后感
2015/06/05 职场文书
2015大学迎新标语
2015/07/16 职场文书
如何制定一份可行的计划!
2019/06/21 职场文书
教师实习自我鉴定总结
2019/08/20 职场文书
Python数据可视化之Seaborn的安装及使用
2022/04/19 Python