Python基于百度AI实现OCR文字识别


Posted in Python onApril 02, 2020

百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别、MQTT服务器、语音识别等等,应有尽有。

Python基于百度AI实现OCR文字识别

Python基于百度AI实现OCR文字识别

看看OCR识别免费的量

Python基于百度AI实现OCR文字识别

Python基于百度AI实现OCR文字识别

快速安装:执行pip install baidu-aip即可

新建一个AipOcr:

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

通用文字识别

""" 读取图片 """
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()

image = get_file_content('example.jpg')

""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);

""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)

url = "http//www.x.com/sample.jpg"

""" 调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url);

""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url, options)

通用文字识别 请求参数详情

Python基于百度AI实现OCR文字识别

通用文字识别 返回数据参数详情

Python基于百度AI实现OCR文字识别

通用文字识别

from aip import AipOcr

#更换为自己的注册信息
APP_ID = '---'
API_KEY = '---'
SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接
fp=open("tu2.png","rb").read()#打开并读取文件内容
res=client.basicGeneral(fp)#普通
#print(res)

#将所有的文字都合并到一起
strx=""
for tex in res["words_result"]:#遍历结果
  strx+=tex["words"]#每一行
print(strx)#输出内容

最终代码

from aip import AipOcr
 
# 定义常量
APP_ID = '14544448'
API_KEY = 'yRZGUXAlCd0c9vQj1kAjBEfY'
SECRET_KEY = 'sc0DKGy7wZ9MeWFGZnbscbRyoDB2IQlj'
 
# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
 
# 读取图片
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()
 
image = get_file_content('binary_best.jpg')
# 调用通用文字识别, 图片为本地图片
res=client.general(image)
print(res)
 
for item in res['words_result']:
  print(item['words'])

例:

from aip import AipOcr
import re
APP_ID='17010327'
API_KEY='X2MWCU1LG1PX5H6GAXgdlWD7'
SECRET_KEY='vz6GZ6TkhSFvY3quqcuC3EG8oEW3kThB'
client=AipOcr(APP_ID,API_KEY,SECRET_KEY)

i=open(r'C:\Users\Administrator\Desktop\example.png','rb')
image = i.read()

result=client.basicGeneral(image)

#将所有的文字都合并到一起
for item in result['words_result']:
  print(item['words'])

Python基于百度AI实现OCR文字识别

通用文字识别client.basicGeneral(image)

通用文字识别(高精度版)client.basicAccurate(image);

通用文字识别(含位置信息版)client.general(image);

通用文字识别(含位置高精度版)client.accurate(image);

通用文字识别(含生僻字版)client.enhancedGeneral(image);

网络图片文字识别client.webImage(image);

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现挑选出来100以内的质数
Mar 24 Python
Python装饰器基础详解
Mar 09 Python
Python对文件和目录进行操作的方法(file对象/os/os.path/shutil 模块)
May 08 Python
python嵌套字典比较值与取值的实现示例
Nov 03 Python
django admin添加数据自动记录user到表中的实现方法
Jan 05 Python
python使用筛选法计算小于给定数字的所有素数
Mar 19 Python
一条命令解决mac版本python IDLE不能输入中文问题
May 15 Python
浅谈PYTHON 关于文件的操作
Mar 19 Python
python实现Excel文件转换为TXT文件
Apr 28 Python
python2 中 unicode 和 str 之间的转换及与python3 str 的区别
Jul 25 Python
Python CSV文件模块的使用案例分析
Dec 21 Python
使用OpenCV对车道进行实时检测的实现示例代码
Jun 19 Python
python 穷举指定长度的密码例子
Apr 02 #Python
python3安装OCR识别库tesserocr过程图解
Apr 02 #Python
python简单的三元一次方程求解实例
Apr 02 #Python
Python 线性回归分析以及评价指标详解
Apr 02 #Python
Django REST framwork的权限验证实例
Apr 02 #Python
详解Ubuntu环境下部署Django+uwsgi+nginx总结
Apr 02 #Python
在 Pycharm 安装使用black的方法详解
Apr 02 #Python
You might like
php文本转图片自动换行的方法
2013/03/13 PHP
PHP如何通过表单直接提交大文件详解
2019/01/08 PHP
JavaScript 自动分号插入(JavaScript synat:auto semicolon insertion)
2009/11/04 Javascript
动态加载script文件的两种方法
2013/08/15 Javascript
火狐下table中创建form导致两个table之间出现空白
2013/09/02 Javascript
使用jquery实现以post打开新窗口
2014/03/19 Javascript
使用jQuery中的when实现多个AJAX请求对应单个回调的例子分享
2014/04/23 Javascript
AngularJS入门教程之学习环境搭建
2014/12/06 Javascript
JavaScript从数组中删除指定值元素的方法
2015/03/18 Javascript
BootStrap初学者对弹出框和进度条的使用感觉
2016/06/27 Javascript
JavaScript的for循环中嵌套一个点击事件的问题解决
2017/03/03 Javascript
利用jquery去掉时光轴头尾部线条的方法实例
2017/06/16 jQuery
ECMAscript 变量作用域总结概括
2017/08/18 Javascript
React学习笔记之列表渲染示例详解
2017/08/22 Javascript
Node.js中使用mongoose操作mongodb数据库的方法
2017/09/12 Javascript
vue自定义过滤器创建和使用方法详解
2017/11/06 Javascript
AnglarJs中的上拉加载实现代码
2018/02/08 Javascript
解决Mac node版本升级失败的问题
2018/05/16 Javascript
setTimeout与setInterval的区别浅析
2019/03/23 Javascript
JavaScript定时器设置、使用与倒计时案例详解
2019/07/08 Javascript
layui使用form表单实现post请求页面跳转的方法
2019/09/14 Javascript
Python实现登陆文件验证方法
2018/10/06 Python
详解Python安装tesserocr遇到的各种问题及解决办法
2019/03/07 Python
python科学计算之numpy——ufunc函数用法
2019/11/25 Python
python实现按关键字筛选日志文件
2019/12/24 Python
Pycharm 2020.1 版配置优化的详细教程
2020/08/07 Python
Python Socket多线程并发原理及实现
2020/12/11 Python
目前不被任何主流浏览器支持的CSS3属性汇总
2014/07/21 HTML / CSS
办公室助理岗位职责
2013/12/25 职场文书
同学聚会主持词
2014/03/18 职场文书
师德自我剖析材料范文
2014/10/06 职场文书
2014年教研组工作总结
2014/11/26 职场文书
三八妇女节寄语
2015/02/27 职场文书
初中团委工作总结
2015/08/13 职场文书
Nginx location 和 proxy_pass路径配置问题小结
2021/09/04 Servers
TV动画《神废柴☆偶像》公布先导PV
2022/03/20 日漫