Python+树莓派+YOLO打造一款人工智能照相机


Posted in Python onJanuary 02, 2018

不久之前,亚马逊刚刚推出了DeepLens 。这是一款专门面向开发人员的全球首个支持深度学习的摄像机,它所使用的机器学习算法不仅可以检测物体活动和面部表情,而且还可以检测类似弹吉他等复杂的活动。虽然DeepLens还未正式上市,但智能摄像机的概念已经诞生了。

Python+树莓派+YOLO打造一款人工智能照相机 

今天,我们将自己动手打造出一款基于深度学习的照相机,当小鸟出现在摄像头画面中时,它将能检测到小鸟并自动进行拍照。最终成品所拍摄的画面如下所示:

Python+树莓派+YOLO打造一款人工智能照相机 

相机不傻,它可以很机智

我们不打算将一个深度学习模块整合到相机中,相反,我们准备将树莓派“挂钩”到摄像头上,然后通过WiFi来发送照片。本着“一切从简”(穷)为核心出发,我们今天只打算搞一个跟DeepLens类似的概念原型,感兴趣的同学可以自己动手尝试一下。

接下来,我们将使用Python编写一个Web服务器,树莓派将使用这个Web服务器来向计算机发送照片,或进行行为推断和图像检测。

Python+树莓派+YOLO打造一款人工智能照相机 

我们这里所使用的计算机其处理能力会更强,它会使用一种名叫 YOLO 的神经网络架构来检测输入的图像画面,并判断小鸟是否出现在了摄像头画面内。

我们得先从YOLO架构开始,因为它是目前速度最快的检测模型之一。该模型专门给Tensorflow(谷歌基于DistBelief进行研发的第二代人工智能学习系统)留了一个接口,所以我们可以轻松地在不同的平台上安装和运行这个模型。友情提示,如果你使用的是我们本文所使用的迷你模型,你还可以用CPU来进行检测,而不只是依赖于价格昂贵的GPU。

接下来回到我们的概念原型上… 如果像框内检测到了小鸟,那我们就保存图片并进行下一步分析。

检测与拍照

Python+树莓派+YOLO打造一款人工智能照相机 

正如我们所说的,DeepLens的拍照功能是整合在计算机里的,所以它可以直接使用板载计算能力来进行基准检测,并确定图像是否符合我们的标准。

但是像树莓派这样的东西,我们其实并不需要使用它的计算能力来进行实时计算。因此,我们准备使用另一台计算机来推断出现在图像中的内容。

我使用的是一台简单的Linux计算机,它带有一个摄像头以及WiFi无线网卡( 树莓派3 + 摄像头 ),而这个简单的设备将作为我的深度学习机器并进行图像推断。对我来说,这是目前最理想的解决方案了,这不仅大大缩减了我的成本,而且还可以让我在台式机上完成所有的计算。

当然了,如果你不想使用树莓派视频照相机的话,你也可以选择在树莓派上安装OpenCV 3来作为方案B,具体的安装方法请参考【这份文档 】。友情提示,安装过程可谓是非常的麻烦!

接下来,我们需要使用Flask来搭建Web服务器,这样我们就可以从摄像头那里获取图像了。这里我使用了 MiguelGrinberg 所开发的网络摄像头服务器代码( Flask视频流框架 ),并创建了一个简单的jpg终端:

#!/usr/bin/envpython
from import lib import import_module
import os
from flask import Flask, render_template, Response
#uncomment below to use Raspberry Pi camera instead
#from camera_pi import Camera
#comment this out if you're not using USB webcam
from camera_opencv import Camera
app =Flask(__name__)
@app.route('/')
def index():
 return "hello world!"
def gen2(camera):
 """Returns a single imageframe"""
 frame = camera.get_frame()
 yield frame
@app.route('/image.jpg')
def image():
 """Returns a single currentimage for the webcam"""
 return Response(gen2(Camera()),mimetype='image/jpeg')
if __name__ == '__main__':
app.run(host='0.0.0.0', threaded=True)

如果你使用的是树莓派视频照相机,请确保没有注释掉上述代码中from camera_pi那一行,然后注释掉from camera_opencv那一行。

你可以直接使用命令python3 app.py或gunicorn来运行服务器,这跟Miguel在文档中写的方法是一样的。如果我们使用了多台计算机来进行图像推断的话,我们还可以利用Miguel所开发的摄像头管理方案来管理摄像头以及计算线程。

当我们启动了树莓派之后,首先需要根据IP地址来判断服务器是否正常工作,然后尝试通过Web浏览器来访问服务器。

URL地址格式类似如下:

http://192.168.1.4:5000/image.jpg

在树莓派中加载Web页面及图像来确定服务器是否正常工作:

Python+树莓派+YOLO打造一款人工智能照相机 

图像导入及推断

既然我们已经设置好了终端来加载摄像头当前的图像内容,我们就可以构建一个脚本来捕捉图像并推断图像中的内容了。

这里我们需要用到request库(一个优秀的Python库,用于从URL地址获取文件资源)以及 Darkflow (YOLO模型基于Tensorflow的实现)。

不幸的是,我们没办法使用pip之类的方法来安装 Darkflow ,所以我们需要克隆整个代码库,然后自己动手完成项目的构建和安装。安装好Darkflow项目之后,我们还需要下载一个YOLO模型。

因为我使用的是速度比较慢的计算机和板载CPU(而不是速度较快的GPU),所以我选择使用YOLO v2迷你网络。当然了,它的功能肯定没有完整的YOLO v2模型的推断准确性高啦!

配置完成之后,我们还需要在计算机中安装Pillow、numpy和OpenCV。最后,我们就可以彻底完成我们的代码,并进行图像检测了。

最终的代码如下所示:

from darkflow.net.build import TFNet
import cv2
from io import BytesIO
import time
import requests
from PIL import Image
import numpy as np
options= {"model": "cfg/tiny-yolo-voc.cfg", "load":"bin/tiny-yolo-voc.weights", "threshold": 0.1}
tfnet= TFNet(options)
birdsSeen= 0
def handleBird():
 pass
whileTrue:
 r =requests.get('http://192.168.1.11:5000/image.jpg') # a bird yo
 curr_img = Image.open(BytesIO(r.content))
 curr_img_cv2 =cv2.cvtColor(np.array(curr_img), cv2.COLOR_RGB2BGR)
 result = tfnet.return_predict(curr_img_cv2)
 print(result)
 for detection in result:
  if detection['label'] == 'bird':
   print("bird detected")
   birdsSeen += 1
   curr_img.save('birds/%i.jpg' %birdsSeen)
 print('running again')
time.sleep(4)

此时,我们不仅可以在命令控制台中查看到树莓派所检测到的内容,而且我们还可以直接在硬盘中查看保存下来的小鸟照片。接下来,我们就可以使用YOLO来标记图片中的小鸟了。

假阳性跟假阴性之间的平衡

我们在代码的options字典中设置了一个threshold键,这个阈值代表的是我们用于检测图像的某种成功率。在测试过程中,我们将其设为了0.1,但是如此低的阈值会给我们带来是更高的假阳性以及误报率。更糟的是,我们所使用的迷你YOLO模型准确率跟完整的YOLO模型相比,差得太多了,但这也是需要考虑的一个平衡因素。

降低阈值意味着我们可以得到更多的模型输出(照片),在我的测试环境中,我阈值设置的比较低,因为我想得到更多的小鸟照片,不过大家可以根据自己的需要来调整阈值参数。

代码开源

跟之前一样,我已经将所有的代码上传到GitHub上了,感兴趣的同学可以自行下载安装【 GitHub传送门 】。

Python 相关文章推荐
Python open()文件处理使用介绍
Nov 30 Python
Python中的元类编程入门指引
Apr 15 Python
Python内存管理方式和垃圾回收算法解析
Nov 11 Python
Linux CentOS7下安装python3 的方法
Jan 21 Python
Python操作MySQL数据库的三种方法总结
Jan 30 Python
python爬取各类文档方法归类汇总
Mar 22 Python
Python中py文件引用另一个py文件变量的方法
Apr 29 Python
Python给定一个句子倒序输出单词以及字母的方法
Dec 20 Python
Python使用pyautocad+openpyxl处理cad文件示例
Jul 11 Python
Python 硬币兑换问题
Jul 29 Python
TensorFlow查看输入节点和输出节点名称方式
Jan 04 Python
Python通过4种方式实现进程数据通信
Mar 12 Python
matplotlib绘制动画代码示例
Jan 02 #Python
Python+matplotlib+numpy实现在不同平面的二维条形图
Jan 02 #Python
Python 实现淘宝秒杀的示例代码
Jan 02 #Python
python基于twisted框架编写简单聊天室
Jan 02 #Python
python http接口自动化脚本详解
Jan 02 #Python
详解用python实现简单的遗传算法
Jan 02 #Python
一个Python最简单的接口自动化框架
Jan 02 #Python
You might like
PHP中的类型提示(type hinting)功能介绍
2015/07/01 PHP
smarty简单应用实例
2015/11/03 PHP
linux mint下安装phpstorm2020包括JDK部分的教程详解
2020/09/17 PHP
工作需要写的一个js拖拽组件
2011/07/28 Javascript
javascript禁用键盘功能键让右击及其他键无效
2013/10/09 Javascript
判断js中各种数据的类型方法之typeof与0bject.prototype.toString讲解
2013/11/07 Javascript
JavaScript对象学习小结
2015/09/02 Javascript
用NODE.JS中的流编写工具是要注意的事项
2016/03/01 Javascript
Vue组件tree实现树形菜单
2017/04/13 Javascript
原生js二级联动效果
2017/06/20 Javascript
Vux+Axios拦截器增加loading的问题及实现方法
2018/11/08 Javascript
jQuery 选择器用法基础入门示例
2020/01/04 jQuery
Javascript节流函数throttle和防抖函数debounce
2020/12/03 Javascript
python基础教程之元组操作使用详解
2014/03/25 Python
Python的SQLalchemy模块连接与操作MySQL的基础示例
2016/07/11 Python
itchat和matplotlib的结合使用爬取微信信息的实例
2017/08/25 Python
python 矩阵增加一行或一列的实例
2018/04/04 Python
Python Pywavelet 小波阈值实例
2019/01/09 Python
python实现祝福弹窗效果
2019/04/07 Python
pandas进行时间数据的转换和计算时间差并提取年月日
2019/07/06 Python
django创建超级用户过程解析
2019/09/18 Python
Python常用模块sys,os,time,random功能与用法实例分析
2020/01/07 Python
Python CSS选择器爬取京东网商品信息过程解析
2020/06/01 Python
英国折扣高尔夫商店:Discount Golf Store
2019/11/19 全球购物
.NET概念性的面试题
2012/02/29 面试题
商场中秋节活动方案
2014/02/07 职场文书
初中学校对照检查材料
2014/08/19 职场文书
村级四风对照检查材料
2014/08/24 职场文书
2014四风问题对照检查材料范文
2014/09/15 职场文书
单位租房协议书范本
2014/12/04 职场文书
品质保证书格式
2015/02/28 职场文书
儿子满月酒致辞
2015/07/29 职场文书
考生诚信考试承诺书(2016版)
2016/03/25 职场文书
JavaScript实现淘宝商品图切换效果
2021/04/29 Javascript
深入理解以DEBUG方式线程的底层运行原理
2021/06/21 Java/Android
Android Studio实现带三角函数对数运算功能的高级计算器
2022/05/20 Java/Android