掘金 人工智能 前天 10:48
rapidocr v3.0.0发布(集成PP-OCRv5)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

RapidOCR v3.0.0版本已发布,主要更新是集成了PP-OCRv5系列模型,包括文本检测和识别模型。该版本与v2.0系列不兼容,升级前需谨慎考虑。新版本调整了参数,支持不同推理引擎和OCR模型组合,提供了更大的灵活性。默认配置仍为PP-OCRv4,用户可根据需求配置使用PP-OCRv5模型。文章提供了安装、验证和使用示例,并强调了新版本参数的灵活性和文档的重要性。

✨ RapidOCR v3.0.0 引入了 PP-OCRv5 系列模型,包括 mobile/server 文本检测和识别模型,实现了核心功能的升级。

💡 与 v2.0 系列不兼容,升级前需仔细考虑,确保代码的兼容性,以免影响现有项目的正常运行。

⚙️ 新版本调整了参数设计,使得用户可以灵活选择不同的推理引擎、不同版本的 OCR 模型,从而满足多样化的需求。

🚀 默认配置仍然是 PP-OCRv4 模型,用户可以根据自身需求配置使用 PP-OCRv5 模型。文章提供了配置示例,方便用户快速上手。

📚 为了方便用户使用,作者提供了详细的文档和在线演示,用户可以通过文档站点和在线 demo 快速了解和测试不同模型的效果。

引言

rapidocrv3.0.0已经发布到pypi了,小伙伴们可以安装使用了。

在这里,我想先强调一下,rapidocrv3.0与v2.0系列主要区别:

总结来说,这次升级与v2.0不兼容,大家请慎重考虑升级。

安装

pip install rapidocr==3.0.0# 便于快速验证,后续看自己安装需要的推理引擎pip install onnxruntime 

验证是否安装成功:

rapidocr check# Success! rapidocr is installed correctly!

使用

此次更新,重新调整了参数,从而可以支持不同阶段可以使用不同推理引擎、不同版本的OCR模型等多种组合,灵活满足需求。

由于PP-OCRv5在自建测评集中,并没有特别突出,因为考虑默认配置仍然是PP-OCRv4rapidocrv3.0.0三个阶段的默认配置均是如下:

engine_type: 'onnxruntime'lang_type: 'ch'model_type: 'mobile'ocr_version: 'PP-OCRv4'

想要使用PP-OCRv5的小伙伴,可以按照下面参数来使用:

from rapidocr import EngineType, LangDet, LangRec, ModelType, OCRVersion, RapidOCRengine = RapidOCR(    params={        "Det.engine_type": EngineType.TORCH,        "Det.lang_type": LangDet.CH,        "Det.model_type": ModelType.MOBILE,        "Det.ocr_version": OCRVersion.PPOCRV5,        "Rec.engine_type": EngineType.PADDLE,        "Rec.lang_type": LangRec.CH,        "Rec.model_type": ModelType.MOBILE,        "Rec.ocr_version": OCRVersion.PPOCRV5,    })img_url = "https://img1.baidu.com/it/u=3619974146,1266987475&fm=253&fmt=auto&app=138&f=JPEG?w=500&h=516"result = engine(img_url)print(result)result.vis("vis_result.jpg")

从上面来看,似乎变得更加繁琐了。但是随着引入了EngineTypeModelTypeOCRVersionLangDetLangRecLangCls枚举类,我们可以更加灵活地使用不同模型了。

这几个参数基本可以任意组合,当然前提是要有对应的模型。为此,我也更新了对应文档中的模型列表文档(rapidai.github.io/RapidOCRDoc…

同时,对应的在线demo也在更新中了,后续会逐步上线,小伙伴遇到需要OCR的图像时,不妨先在在线demo上快速查看某些场景图像的效果,从而方便决定用哪个参数,哪个模型

由于官方文档站点已经尽量详细地介绍如何使用v3.0系列模型了。在这里,我不再过多赘述,欢迎小伙伴们前往文档站点查看。(rapidai.github.io/RapidOCRDoc…)

相关文档

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RapidOCR PP-OCRv5 OCR 模型升级
相关文章