python3.5+tesseract+adb实现西瓜视频或头脑王者辅助答题


Posted in Python onJanuary 17, 2018

最近的答题赢钱很火爆,我也参与了几次,有些题目确实很难答,但是10秒钟的时间根本不够百度的,所以写了个辅助挂,这样可以出现题目时自动百度,这个时间也就花掉2秒钟,剩下的7、8秒钟可以进行分析和作答,提升了赢钱概率。

源码可以见我的github:点击链接

原理分析下:使用adb命令,抓取手机视频播放的界面,然后通过python的截取和ocr,获得到题目和答案, 然后百度得到结果。这个环境怎么搭建,有需要的童鞋可以联系我,因为使用本地的ocr所以解析不花钱,也没有使用的限制。

github上的代码中  

   ocr_bw.py,这个是自动根据题目去百度,然后打开浏览器,展示检索结果

# -*- coding: utf-8 -*-

import pytesseract
import time
import webbrowser
import subprocess
from PIL import Image



def main():
 """
 主函数
 """
 op = yes_or_no('请确保手机打开了 ADB 并连接了电脑,'
     '然后打开西瓜视频后再用本程序,确定开始?')
 if not op:
  print('bye')
  return
 #核心递归
 ocr_subject_parent()

 # for root, sub_dirs, files in os.walk('E:/临时接收的文件/知乎答题/百万/'):
 #  for file in files:
 #   print('发现图片:' + file)
 #   img = Image.open('E:/临时接收的文件/知乎答题/百万/'+file)
 #   ocr_subject(img)


def yes_or_no(prompt, true_value='y', false_value='n', default=True):
 """
 检查是否已经为启动程序做好了准备
 """
 default_value = true_value if default else false_value
 prompt = '{} {}/{} [{}]: '.format(prompt, true_value,
          false_value, default_value)
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  elif i == false_value:
   return False
  prompt = 'Please input {} or {}: '.format(true_value, false_value)
  i = input(prompt)


def screenImg(true_value='', default=True):
 prompt = '当出现题目时,请按下回车进行识别 '
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  else:
   return False
  i = input(prompt)


def ocr_subject(p):
 # 截取 距离上530开始 940结束
 # 截取 距离上260 570结束
 p = cut_img(p)
 pytesseract.pytesseract.tesseract_cmd = 'E:/Program Files (x86)/Tesseract-OCR/tesseract'
 subject = pytesseract.image_to_string(p, lang='chi_sim')
 subject = "".join(subject.split())
 subject = subject.split('.')[1]
 print(subject)
 openPage(subject)
 ocr_subject_parent()


def ocr_subject_parent():
 result = screenImg()
 if result:
  start = time.time()
  # screenshot.check_screenshot()
  process = subprocess.Popen(
   'adb shell screencap -p',
   shell=True, stdout=subprocess.PIPE)
  binary_screenshot = process.stdout.read()
  binary_screenshot = binary_screenshot.replace(b'\r\n', b'\n')
  f = open('autojump.png', 'wb')
  f.write(binary_screenshot)
  f.close()
  # screenshot.pull_screenshot()
  img = Image.open('autojump.png')
  print("耗时:" + str(time.time() - start))
  ocr_subject(img)


def openPage(subject):
 url = 'https://www.baidu.com/s?wd={}'.format(
  subject)
 webbrowser.open(url)
 webbrowser.get()



def cut_img(img):
 region = img.crop((70, 260, 1025, 570))
 #region.save("temp/cut_first.png")
 return region


if __name__ == '__main__':
 main()

   ocr_bw2.py,这个是根据题目+答案,去百度检索,通过爬虫抓取百度的收录数,然后在控制台打印结果

__author__ = 'zjy'
# -*- coding:utf-8 -*-

import pytesseract
import time
import webbrowser
import subprocess
from PIL import Image
import urllib
import urllib.request
import threading
from urllib.parse import quote


def main():
 """
 主函数
 """
 op = yes_or_no('请确保手机打开了 ADB 并连接了电脑,'
     '然后打开西瓜视频后再用本程序,确定开始?')
 if not op:
  print('bye')
  return
 # 核心递归
 ocr_subject_parent()

 # for root, sub_dirs, files in os.walk('E:/临时接收的文件/知乎答题/百万/'):
 #  for file in files:
 #   print('发现图片:' + file)
 #   img = Image.open('E:/临时接收的文件/知乎答题/百万/'+file)
 #   ocr_subject(img)


def yes_or_no(prompt, true_value='y', false_value='n', default=True):
 """
 检查是否已经为启动程序做好了准备
 """
 default_value = true_value if default else false_value
 prompt = '{} {}/{} [{}]: '.format(prompt, true_value,
          false_value, default_value)
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  elif i == false_value:
   return False
  prompt = 'Please input {} or {}: '.format(true_value, false_value)
  i = input(prompt)


def screenImg(true_value='', default=True):
 prompt = '当出现题目时,请按下回车进行识别 \n'
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  else:
   return False
  i = input(prompt)


def ocr_subject(p):
 # 截取 距离上530开始 940结束
 # 截取 距离上260 570结束
 subImg = cut_img(p)
 pytesseract.pytesseract.tesseract_cmd = 'E:/Program Files (x86)/Tesseract-OCR/tesseract'
 subject = pytesseract.image_to_string(subImg, lang='chi_sim')
 subject = "".join(subject.split())
 subject = subject.split('.')[1].replace("\"", "")
 print(subject)
 ocr_answer(p, subject)
 # openPage(subject)
 # print("结束:" + str(time.time()))
 ocr_subject_parent()


def getSearchNum(key):
 key = quote(key)
 # print(key)
 url = 'http://www.baidu.com/s?wd={}'.format(key)
 # print(url)
 response = urllib.request.urlopen(url)
 page = response.read().decode("utf-8")
 i = int(page.index('百度为您找到相关结果约'))
 start = i + 10
 end = i + 25
 page = page[start: end]
 return page


def ocr_answer(p, subject):
 list = cut_question(p)
 pytesseract.pytesseract.tesseract_cmd = 'E:/Program Files (x86)/Tesseract-OCR/tesseract'
 for p in list:
  t = threading.Thread(target=ocr_answer_thread, args=(p, subject))
  t.start()


def ocr_answer_thread(p, subject):
 answer = pytesseract.image_to_string(p, lang='chi_sim')
 answer = "".join(answer.split())
 v = getSearchNum(subject + ' ' + answer)
 print(answer + ' ' + v)
 # print(time.time())


def ocr_subject_parent():
 result = screenImg()
 if result:
  start = time.time()
  # print("开始:" + str(start))
  # screenshot.check_screenshot()
  process = subprocess.Popen(
   'adb shell screencap -p',
   shell=True, stdout=subprocess.PIPE)
  binary_screenshot = process.stdout.read()
  binary_screenshot = binary_screenshot.replace(b'\r\n', b'\n')
  f = open('autojump.png', 'wb')
  f.write(binary_screenshot)
  f.close()
  # screenshot.pull_screenshot()
  img = Image.open('autojump.png')
  ocr_subject(img)


def openPage(subject):
 url = 'https://www.baidu.com/s?wd={}'.format(
  subject)
 webbrowser.open(url)
 webbrowser.get()


def cut_img(img):
 region = img.crop((70, 260, 1025, 570))
 # region.save("temp/cut_first.png")
 return region


def cut_question(img):
 list = []
 question1 = img.crop((70, 590, 1025, 768))
 question2 = img.crop((70, 769, 1025, 947))
 question3 = img.crop((70, 948, 1025, 1130))
 list.append(question1)
 list.append(question2)
 list.append(question3)
 # question1.save("temp/cut_1.png")
 # question2.save("temp/cut_2.png")
 # question3.save("temp/cut_3.png")
 return list


if __name__ == '__main__':
 main()

由于很多题目是下列哪个不是,所以我更喜欢用第一个方式,基本上识别时间在0.5-0.6秒之间。

python3.5+tesseract+adb实现西瓜视频或头脑王者辅助答题

最后里面的ocr_zh.py是可以用来抓取头脑王者的辅助。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中from module import * 的一个坑
Jul 20 Python
在Python的Django框架中加载模版的方法
Jul 16 Python
Windows下python2.7.8安装图文教程
May 26 Python
Python探索之Metaclass初步了解
Oct 28 Python
python机器学习之神经网络(一)
Dec 20 Python
python读文件保存到字典,修改字典并写入新文件的实例
Apr 23 Python
python实现字符串中字符分类及个数统计
Sep 28 Python
python笔记之mean()函数实现求取均值的功能代码
Jul 05 Python
Python3将jpg转为pdf文件的方法示例
Dec 13 Python
Python正则表达式急速入门(小结)
Dec 16 Python
Iconfont(矢量图标)+iconmoon(图标svg互转)配合javascript实现社交分享系统
Apr 21 Python
PyQt5结合matplotlib绘图的实现示例
Sep 15 Python
python+matplotlib绘制3D条形图实例代码
Jan 17 #Python
《Python学习手册》学习总结
Jan 17 #Python
浅谈Python对内存的使用(深浅拷贝)
Jan 17 #Python
Python分支结构(switch)操作简介
Jan 17 #Python
python2 与python3的print区别小结
Jan 16 #Python
python正则中最短匹配实现代码
Jan 16 #Python
Python程序员面试题 你必须提前准备!
Jan 16 #Python
You might like
PHP遍历目录并返回统计目录大小
2014/06/09 PHP
yii2.0使用Plupload实现带缩放功能的多图上传
2015/12/22 PHP
ThinkPHP使用Smarty第三方插件方法小结
2016/03/19 PHP
10个值得深思的PHP面试题
2016/11/14 PHP
php+ajax无刷新上传图片的实现方法
2016/12/06 PHP
PHP的简单跳转提示的实现详解
2019/03/14 PHP
js操作二级联动实现代码
2010/07/27 Javascript
javascript 使td内容不换行不撑开
2012/11/29 Javascript
JS添加删除一组文本框并对输入信息加以验证判断其正确性
2013/04/11 Javascript
jquery缓动swing liner控制动画过程不同时刻的速度
2014/05/29 Javascript
jQuery实现checkbox列表的全选、反选功能
2016/11/24 Javascript
解决拦截器对ajax请求的拦截实例详解
2016/12/21 Javascript
JavaScript箭头函数_动力节点Java学院整理
2017/06/28 Javascript
jQuery实现可兼容IE6的淡入淡出效果告警提示功能示例
2017/09/20 jQuery
Vue多种方法实现表头和首列固定的示例代码
2018/02/02 Javascript
详解用Webpack与Babel配置ES6开发环境
2019/03/12 Javascript
详解微信小程序实现跑马灯效果(附完整代码)
2019/04/29 Javascript
koa2 数据api中间件设计模型的实现方法
2020/07/13 Javascript
Vue项目中数据的深度监听或对象属性的监听实例
2020/07/17 Javascript
微信小程序实现拼图小游戏
2020/10/22 Javascript
如何使用RoughViz可视化Vue.js中的草绘图表
2021/01/30 Vue.js
windows下Python实现将pdf文件转化为png格式图片的方法
2017/07/21 Python
python使用Plotly绘图工具绘制水平条形图
2020/03/25 Python
Django工程的分层结构详解
2019/07/18 Python
python 魔法函数实例及解析
2019/09/25 Python
python脚本后台执行方式
2019/12/21 Python
Python3+selenium实现cookie免密登录的示例代码
2020/03/18 Python
6种非常炫酷的CSS3按钮边框动画特效
2016/03/16 HTML / CSS
简述安装Slackware Linux系统的过程
2012/05/08 面试题
眼镜促销方案
2014/03/15 职场文书
中学生纪念九一八事变演讲稿
2014/09/14 职场文书
自我查摆剖析材料
2014/10/11 职场文书
群众路线领导班子整改方案
2014/10/25 职场文书
保护环境建议书作文400字
2015/09/14 职场文书
nginx反向代理配置去除前缀案例教程
2021/07/26 Servers
SQL实战演练之网上商城数据库商品类别数据操作
2021/10/24 MySQL