02.25 简单实用，准确高效，Python利用百度文字识别服务实现图片文字提取_科技 _ 頭條網

最近很多人同学私聊，想要这篇文章中的源码，特意重发一下，文中代码可粘贴复制。

最近和同事聊天，聊到一个比较充满使命感的心酸的话题——在网上给小朋友抄题。。。那么问题来了，除了大家所知的QQ文字识别功能之外，还有哪些方式可以做到文字识别呢。

作为一名热心的Python小工，我想这个问题可以尝试着使用Python解决一下，看下效果。

Google一下，发现很多大的厂商（百度、阿里、腾讯等）已有相关的API开放使用，那么我们今天就以百度为例，分享下如何使用百度文字识别（OCR）服务，实现文字提取，其实三者都尝试过，感觉百度的效果最好（非评测），所以本文就以百度为例。

先简单介绍下，百度大脑AI开发平台，首先我们需要注册下开发平台用户，非常简单，手机号码注册即可。

http://ai.baidu.com/

登录后我们可以在控制台看到，开发平台提供的众多服务，其中有文字识别服务。

创建一个文字识别服务应用，如下

简单操作后，我们就可以成功创建一个服务应用，如下，其中AppID、API Key、Secret Key是我们后面调用OCR服务时需要用到的。

接下来，我们看下如何使用Python调用百度OCR服务实现文字提取。

Python实现

代码设计

图片压缩：由于OCR服务对图片大小有限制，因此在使用时若图片大小超过最大限制，要进行压缩处理。OCR调用：实现利用百度OCR服务提取单张图片文字，返回文字内容。批量处理：实现N张图片的文字提取，并且保存提取结果到文本文件中。

图片压缩

<code> def photo_compression(original_image , tmp_image_path): """ 图片备份、压缩 :param original_image: 原始图片路径 :param tmp_image_path: 临时图片路径，备份路径 :return: """ from PIL import Image img = Image.open(original_image) width, height = img.size # 该数值压缩后的图片大约 200k+ while (width * height > 4000000): width = width // 2 height = height // 2 e_img = img.resize((width, height), Image.BILINEAR) save_path = path.join(tmp_image_path, os.path.basename(original_image)) e_img.save(save_path) return save_path/<code>

OCR服务调用

该函数中使用到在上一章节，提到的AppID、API Key、Secret Key信息。

在代码中，我们使用了basicGeneral（通用文字识别），每天免费使用50000次，还有basicAccurate通用文字识别（高精度版），每天免费使用500次。基本满足我们日常使用，若不够，可以再使用其他文字识别服务。

<code> def ocr(original_image): """ 使用百度OCR进行文字识别，支持jpg/jpeg/png/bmp格式 :param original_image: 待识别图片 :return: """ from aip import AipOcr filename = path.basename(original_image) APP_ID = '16572971' API_KEY = '97jmvxVbuce8B3AQtxUirQ00' SECRECT_KEY = 'dWAdA12ByPnSKzMI0MAXyvUwfDh171Cn' client = AipOcr(APP_ID, API_KEY, SECRECT_KEY) with open(original_image, 'rb') as picfile_read: img = picfile_read.read() print "正在识别图片: {0} ……".format(filename) try: # 通用文字识别，50000次/天免费 result = client.basicGeneral(img) except: # 通用文字识别（高精度版），500次/天免费 result = client.basicAccurate(img) return result /<code>

批量处理

通过传入单张图片或多张图片，调用OCR服务实现批量图片文字提取。

<code> def run_ocr( original_image, tmp_image_path, result_file_path='identify_results.txt'): """ 主函数批量执行图片文本识别，结果存储 :param original_image: 原始图片 :param tmp_image_path: 临时图片 :param result_file_path: 识别文字存储文件 :return: """ # 判断是否存在历史识别结果，若存在则删除 if path.exists(result_file_path): os.remove(result_file_path) # 判断临时图片路径是否存在，若不存在则创建 if not path.exists(tmp_image_path): os.mkdir(tmp_image_path) # 临时文件路径列表 tmp_file_path = [] for picfile in glob.glob(original_image): tmp_file = photo_compression(picfile, tmp_image_path) tmp_file_path.append(tmp_file) # 遍历所有文件，进行ocr识别结果存储 for picfile in tmp_file_path: result = ocr(picfile) lines = [text.get('words').encode('utf-8') + '\\n' for text in result.get('words_result')] with open(result_file_path, 'a+') as fo: fo.writelines("=" * 100 + '\\n') fo.writelines("【识别图片】: {0} \\n".format(path.basename(picfile) )) fo.writelines("【文本内容】: \\n") fo.writelines(lines) os.remove(picfile) if __name__ == "__main__": tmp_image_path = r'D:\\learn\\tmp' original_image = r"D:\\learn\\*.png" run_ocr(original_image,tmp_image_path) /<code>

效果如下

单张图片

识别结果

<code> 软件测试开发技术栈V 文章视频微头条收藏支持反编译,阿里开源性能监控分析神器 Arthas 1.0万阅读·15评论·2019-06-17 22:30 /<code>

识别结果

<code> Arthas(阿尔萨斯)是 Alibaba开源的Java诊断性能监控分析工具,它不需要做任何的参数配置,就可以直观的获取各种维庋的性能数据。通过阅读官网的介绍,可以看到,当我们遇到以下类似问题而束手无策时, Arthas可以帮助我们解决这个类从哪个jar包加载的?为什么会报各种类相关的 EXception? ■我改的代码为什么没有执行到?难道是我没 commit?分支搞错了? ■遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗? 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现! ■是否有一个全局视角来查看系统的运行状况? ■有什么办法可以监控到M的实时运行状态? Arthas支持JDK6+,支持 Linux/Mac∧ Winodws,采用命令行交互模式,同时提供丰富的 Tab自动补全功能,进一步方便进行问题的定位和诊断/<code>

批量处理结果

Python实现

OCR服务调用

批量处理

效果如下

相關文章:

这些新功能太实用了！QQ新版详细体验

他来了，他来了，文字、表格、公式图片识别神器V0.1测试版

区块链——文字“法宝”

计算机中数字、文字、图像、声音和视频的表示与编码

百度大脑OCR技术全分享 文字、票据检测识别应用表现行业第一

2019年，文字、短视频、音频内容创作者的主场在哪？

腕语智能翻译机：语音+文字，打通翻译“最后一公里”

桌面神器！「双击 Ctrl + C」文字、网页、文件一键收藏

华为黑科技网站，集成五大主流技术：图像、文字、语音一键识别！

小米太无耻了。

蹭热点！说说我理解的手机包装盒事件。

苹果公司正式发布iPhone SE二代手机

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

干翻华为P40系列 荣耀30也玩中

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

苹果发布新款iPhoneSE，3299元起售

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

值得收藏！三类卖家三种选品方案，总有适合你的一个……

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

马云终于要辞职了，留下的话句句触动人心

等等，明年5G手机将迎来大降价

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

为什么华为今天可以傲视群雄，在世界上立于不败之地？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

2020年最强拍照旗舰来了 华为P40系列多项业界首创 香！

今天聊一聊直播

通过直播赚钱不容易，既要豁得出去，又要端得起来

AI和自动化技术联手，最终会让60%的工人失去现有的饭碗。

这个网还能不能好好上了？今日全球IPv4地址正式耗尽

12306系统不行？内行人告诉你它有多牛，阿里腾讯高手去了也膜拜

有内幕？美国防部授与微软百亿云合同，亚马逊不满发起诉讼

未来之芯--RISC-V总部从美国迁往瑞士，华为、阿里是其成员

神话还能继续吗？几度过山车，比特币半年来首次跌破7000美元

刘强东卸任后，突然宣布一个“好消息”，让马云措手不及！

苹果的疯狂其实从未停止，AirPower或将重新启航

百度大脑OCR技术全分享文字、票据检测识别应用表现行业第一

干翻华为P40系列荣耀30也玩中

2020年最强拍照旗舰来了华为P40系列多项业界首创香！