编程 Python

轻松实现TensorFlow微信跳一跳的AI

Posted in Python onJanuary 05, 2018

作为python和机器学习的初学者，目睹了AI玩游戏的各种风骚操作，心里也是跃跃欲试。

然后发现微信跳一跳很符合需求，因为它不需要处理连续画面（截屏太慢了）和复杂的操作，很适合拿来练手。于是…这个东西诞生了，目前它一般都可以跳到100多分，发挥好了能上200。

1.需要设备：

Android手机，数据线
ADB环境
Python环境（本例使用3.6.1）
TensorFlow（本例使用1.0.0）

2.大致原理

使用adb模拟点击和截屏，使用两层卷积神经网络作为训练模型，截屏图片作为输入，按压毫秒数直接作为为输出。

3.训练过程

最开始想的用强化学习，然后发现让它自己去玩成功率太！低！了！，加上每次截屏需要大量时间，就放弃了这个方法，于是考虑用自己玩的数据作为样本喂给它，这样就需要知道每次按压的时间。

我是这样做的，找一个手机写个app监听按压屏幕时间，另一个手机玩游戏，然后两个手指同时按两个手机o(?□?)o

4.上代码

首先，搭建模型：

第一层卷积：5*5的卷积核，12个featuremap，此时形状为96*96*12
池化层：4*4 max pooling，此时形状为24*24*12
第二层卷积：5*5的卷积核，24个featuremap，此时形状为20*20*24
池化层：4*4 max pooling，此时形状为5*5*24
全连接层：5*5*24连接到32个节点，使用relu激活函数和0.4的dropout率
输出：32个节点连接到1个节点，此节点就代表按压的时间（单位s）

# 输入：100*100的灰度图片，前面的None是batch size，这里都为1 
x = tf.placeholder(tf.float32, shape=[None, 100, 100, 1]) 
# 输出：一个浮点数，就是按压时间，单位s 
y_ = tf.placeholder(tf.float32, shape=[None, 1]) 
 
# 第一层卷积 12个feature map 
W_conv1 = weight_variable([5, 5, 1, 12], 0.1) 
b_conv1 = bias_variable([12], 0.1) 
# 卷积后为96*96*12 
 
h_conv1 = tf.nn.relu(conv2d(x, W_conv1) + b_conv1) 
h_pool1 = max_pool_4x4(h_conv1) 
# 池化后为24*24*12 
 
# 第二层卷积 24个feature map 
W_conv2 = weight_variable([5, 5, 12, 24], 0.1) 
b_conv2 = bias_variable([24], 0.1) 
# 卷积后为20*20*24 
 
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) 
h_pool2 = max_pool_4x4(h_conv2) 
# 池化后为5*5*24 
 
# 全连接层5*5*24 --> 32 
W_fc1 = weight_variable([5 * 5 * 24, 32], 0.1) 
b_fc1 = bias_variable([32], 0.1) 
h_pool2_flat = tf.reshape(h_pool2, [-1, 5 * 5 * 24]) 
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1) 
 
# drapout，play时为1训练时为0.6 
keep_prob = tf.placeholder(tf.float32) 
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob) 
# 学习率 
learn_rate = tf.placeholder(tf.float32) 
 
# 32 --> 1 
W_fc2 = weight_variable([32, 1], 0.1) 
b_fc2 = bias_variable([1], 0.1) 
y_fc2 = tf.matmul(h_fc1_drop, W_fc2) + b_fc2 
 
# 因输出直接是时间值，而不是分类概率，所以用平方损失 
cross_entropy = tf.reduce_mean(tf.square(y_fc2 - y_)) 
train_step = tf.train.AdamOptimizer(learn_rate).minimize(cross_entropy)

其次，获取屏幕截图并转换为模型输入：

# 获取屏幕截图并转换为模型的输入 
def get_screen_shot(): 
  # 使用adb命令截图并获取图片，这里如果把后缀改成jpg会导致TensorFlow读不出来 
  os.system('adb shell screencap -p /sdcard/jump_temp.png') 
  os.system('adb pull /sdcard/jump_temp.png .') 
  # 使用PIL处理图片，并转为jpg 
  im = Image.open(r"./jump_temp.png") 
  w, h = im.size 
  # 将图片压缩，并截取中间部分，截取后为100*100 
  im = im.resize((108, 192), Image.ANTIALIAS) 
  region = (4, 50, 104, 150) 
  im = im.crop(region) 
  # 转换为jpg 
  bg = Image.new("RGB", im.size, (255, 255, 255)) 
  bg.paste(im, im) 
  bg.save(r"./jump_temp.jpg") 
 
  img_data = tf.image.decode_jpeg(tf.gfile.FastGFile('./jump_temp.jpg', 'rb').read()) 
  # 使用TensorFlow转为只有1通道的灰度图 
  img_data_gray = tf.image.rgb_to_grayscale(img_data) 
  x_in = np.asarray(img_data_gray.eval(), dtype='float32') 
 
  # [0,255]转为[0,1]浮点 
  for i in range(len(x_in)): 
    for j in range(len(x_in[i])): 
      x_in[i][j][0] /= 255 
 
  # 因为输入shape有batch维度，所以还要套一层 
  return [x_in]

以上代码过程大概是这样：

轻松实现TensorFlow微信跳一跳的AI

最后，开始训练：

while True: 
 
  ………… 
 
  # 每训练100个保存一次 
  if train_count % 100 == 0: 
    saver_init.save(sess, "./save/mode.mod") 
 
  …………   
  
  sess.run(train_step, feed_dict={x: x_in, y_: y_out, keep_prob: 0.6, learn_rate: 0.00005})

训练所用数据是直接从采集好的文件中读取的，由于样本有限（目前采集了800张图和对应800个按压时间，在github上train_data文件夹里），并且学习率太大又会震荡，只能用较小学习率反复学习这些图片。

5.总结

1.样本的按压时间大都分布在300ms到900ms之间，刚开始训练的时候发现不论什么输入，输出都一直很谨慎的停留在600左右，还以为这种方法不可行。不过半个小时后再看发现已经有效果了，对于不同的输入，输出值差距开始变大了。所以…相信卷积网络的威力，多给它点耐心。

2.由于我自己最多玩到100多分，后面的数据没法采集到，所以当后面物体变得越来越小时，这个AI也会变得容易挂掉。理论上说让它自己探索不会有这个瓶颈，只是截屏时间实在难以忍受。

3.目前还是初级的版本，有很多可以优化的地方，比如说识别左上角的分数，如果某次跳跃得分较高，那么可以把这次的学习率增大；检测特殊物体，比如超市音乐盒，就停留几秒再进行下一次跳跃，等等。

下面是github地址，源码加注释总共不到300行：
https://github.com/zhanyongsheng/LetsJump

更多内容大家可以参考专题《微信跳一跳》进行学习。

轻松实现TensorFlow微信跳一跳的AI

- Author -

zhanys_7

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中实现两个字典（dict）合并的方法

Sep 23 Python

python使用urllib2提交http post请求的方法

May 26 Python

Python 类与元类的深度挖掘 II【经验】

May 06 Python

python自动发送邮件脚本

Jun 20 Python

python 列表,数组和矩阵sum的用法及区别介绍

Jun 28 Python

对Python中数组的几种使用方法总结

Jun 28 Python

python的scikit-learn将特征转成one-hot特征的方法

Jul 10 Python

Python实现动态添加属性和方法操作示例

Jul 25 Python

详解Django-auth-ldap 配置方法

Dec 10 Python

解决pycharm中的run和debug失效无法点击运行

Jun 09 Python

Python通过类的组合模拟街道红绿灯

Sep 16 Python

Python 调用C++封装的进一步探索交流

Mar 04 Python

OpenCV-Python实现轮廓检测实例分析

Jan 05 #Python

django2 快速安装指南分享

Jan 05 #Python

Python实现改变与矩形橡胶的线条的颜色代码示例

Jan 05 #Python

用python制作游戏外挂

Jan 04 #Python

Python学习之Anaconda的使用与配置方法

Jan 04 #Python

Windows下Anaconda的安装和简单使用方法

Jan 04 #Python

Python+OpenCV让电脑帮你玩微信跳一跳

Jan 04 #Python

You might like

PHP 页面编码声明方法详解(header或meta)

2010/03/12 PHP

php删除文件夹及其文件夹下所有文件的函数代码

2013/01/23 PHP

destoon在360浏览器下出现用户被强行注销的解决方法

2014/06/26 PHP

Yii2主题(Theme)用法详解

2016/07/23 PHP

js 日期转换成中文格式的函数

2009/07/07 Javascript

jQuery基本过滤选择器使用介绍

2013/04/18 Javascript

DOM节点的替换或修改函数replaceChild()用法实例

2015/01/12 Javascript

JS+CSS实现简单滑动门(滑动菜单)效果

2015/09/19 Javascript

Javascript实现鼠标框选操作不是点击选取

2016/04/14 Javascript

js验证框架之RealyEasy验证详解

2016/06/08 Javascript

简单实现jQuery进度条轮播实例代码

2016/06/20 Javascript

老生常谈JavaScript 正则表达式语法

2016/08/20 Javascript

JavaScript canvas实现雪花随机动态飘落

2020/02/08 Javascript

解决vue addRoutes不生效问题

2020/08/04 Javascript

[01:47]2018年度DOTA2最佳教练-完美盛典

2018/12/16 DOTA

[01:11:28]DOTA2-DPC中国联赛定级赛 RNG vs Phoenix BO3第一场 1月8日

2021/03/11 DOTA

基于python时间处理方法(详解)

2017/08/14 Python

Python爬虫解析网页的4种方式实例及原理解析

2019/12/30 Python

通过python实现windows桌面截图代码实例

2020/01/17 Python

python实现将两个文件夹合并至另一个文件夹(制作数据集)

2020/04/03 Python

Python中的xlrd模块使用原理解析

2020/05/21 Python

python软件都是免费的吗

2020/06/18 Python

Python pip安装第三方库实现过程解析

2020/07/09 Python

html5.2 dialog简介详解

2018/02/27 HTML / CSS

世界上最大的汽车共享网站：Zipcar

2017/01/14 全球购物

Jacadi Paris英国官网：法国童装品牌

2019/08/09 全球购物

应届生船舶驾驶求职信

2013/10/19 职场文书

产品设计开发计划书

2014/05/07 职场文书

三好学生事迹材料

2014/12/24 职场文书

项目经理助理岗位职责

2015/04/13 职场文书

大学推普周活动总结

2015/05/07 职场文书

《花钟》教学反思

2016/02/17 职场文书

68句权威创业名言

2019/08/26 职场文书

详解使用 CSS prefers-* 规范提升网站的可访问性与健壮性

2021/05/25 HTML / CSS

win11怎么用快捷键锁屏? windows11锁屏的几种方法

2021/11/21 数码科技

python 安全地删除列表元素的方法

2022/03/16 Python