最近做字体库,需要识别图片上的内容,接入百度OCR 识别打印字体能达到99.9%,但识别手写的字 和毛笔字则识别不出来。下面的代码 大家可以学习一下。
import os
from aip import AipOcr
# 定义常量
APP_ID = '4019744406'
API_KEY = 'YLOtSqASDTU6rZOmCUk466hDg'
SECRET_KEY = 'ukICHsUhKDyoZ534FD06k4XwISKnV5TL'
# 初始化AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def ocr_baidu(image_path):
withopen(image_path, 'rb') asfile:
image_data=file.read()
# 调用百度云API进行文字识别
result=client.handwriting(image_data)
# 提取并返回结果
text_result= []
if'words_result'inresult:
foriteminresult['words_result']:
text_result.append(item['words'])
return'\n'.join(text_result)
if __name__ == "__main__":
directory="output_slices"
supported_extensions= ['.jpg', '.jpeg', '.png']
all_text_results= []
forfilenameinos.listdir(directory):
ifany(filename.endswith(ext) forextinsupported_extensions):
image_path=os.path.join(directory, filename)
text_result=ocr_baidu(image_path)
# 打印每张图片的识别结果到终端
print(f"Image: {filename}, Text: {text_result}")
all_text_results.append(text_result)
# 保存所有识别结果到一个文本文件中
withopen('ocr_results.txt', 'w') asf:
f.write('\n\n'.join(all_text_results))
END
如本资源侵犯了您的权益,请联系投诉邮箱admin@wmphp.com进行举报!我们将在收到邮件的1个小时内处理完毕。
本站仅为平台,发布的资源均为用户投稿或转载!所有资源仅供参考学习使用,请在下载后的24小时内删除,禁止商用!
Wmphp.com(完美源码)助力正版,如您有自己的原创产品,可以联系客服投稿,代理出售!
Wmphp.com(完美源码)客服QQ:136882447
Wmphp.com(完美源码)商务电话(仅对企业客户/个人用户):15120086569 (微信同步)
请注意:本站不提供任何免费的技术咨询服务,为了节约时间,下载前 请确认自己会技术
完美源码 » 百度OCR批量识别文件夹内图片内容
完美源码 » 百度OCR批量识别文件夹内图片内容