将PaddleOCR 转为 ONNX 运行

paddleocr,onnx · 浏览次数 : 0

小编点评

本文将介绍如何将PaddleOCR的PP_OCRv4模型转换为ONNX格式,以便在不需要使用Paddle框架的情况下使用PaddleOCR的强大检测性能。文章分为两个步骤: 步骤1:将PaddleOCR模型转换为ONNX格式 1. 访问PaddleOCR项目主页(https://github.com/PaddlePaddle/PaddleOCR),下载最新的v4版检测与识别模型。 2. 安装PaddlePaddle到ONNX的模型转换工具:https://github.com/PaddlePaddle/Paddle2ONNX。 3. 使用paddle2onnx工具将paddle格式模型转换为ONNX格式。具体命令如下: ``` paddle2onnx --model_dir /mnt/d/Downloads/202406/paddelocr/pp/ch_PP-OCRv4_det_infer/ --model_filename inference.pdmodel --params_filename inference.pdiparams --opset_version 11 --save_file /mnt/d/Downloads/202406/paddelocr/onnx/ch_PP-OCRv4_det_infer.onnx ``` 同样地,将模型目录更改为/pp_ch_PP-OCRv4_rec_infer/,并运行第二个命令进行转换。 步骤2:运行ONNX推理 1. 下载基于转换后的ppocr_server_v2.0模型的OnnxOCR代码(https://github.com/jingsongliujing/OnnxOCR)。 2. 在此代码基础上集成转换好的ONNX模型。修改部分包括: - 在`preprocess.py`文件中添加预处理部分的代码。 - 在`inference.py`文件中添加后处理部分的代码。 3. 运行Inference代码,使用转换后的ONNX模型进行文本识别。 总结:本文介绍了如何将PaddleOCR的PP_OCRv4模型转换为ONNX格式,以便在没有Paddle框架的情况下使用PaddleOCR的强大检测性能。通过使用Paddle2ONNX工具,可以将PaddleOCR模型轻松转换为ONNX格式,从而避免Paddle框架带来的兼容性问题。在此基础上,利用OnnxOCR代码完成预处理和后处理步骤,实现文本识别任务。

正文

PaddleOCR 是目前最好的开源OCR框架, 但paddle框架的兼容性实在不怎么好, 部署的时候容易出现各种各样的问题. 如果能把PaddleOCR转成ONNX, 就可以跳过paddle框架坑的同时, 又可以白嫖PaddleOCR的强大检测性能.

本文会介绍一下, 如何把最新的PP_OCRv4模型转成onxx格式, 并正确运行.

 

步骤1: PaddleOCR模型转ONNX

  1. 原始网络权重下载
    在PaddleOCR的项目主页 https://github.com/PaddlePaddle/PaddleOCR 下载最新的v4版检测与识别模型.

  2. 模型权重转ONNX
    用pip安装PaddlePaddle到ONNX的模型转换工具: https://github.com/PaddlePaddle/Paddle2ONNX.
    参照如下命令转换paddle格式模型到ONNX格式.

    paddle2onnx --model_dir /mnt/d/Downloads/202406/paddelocr/pp/ch_PP-OCRv4_det_infer/ --model_filename inference.pdmodel --params_filename inference.pdiparams --opset_version 11 --save_file /mnt/d/Downloads/202406/paddelocr/onnx/ch_PP-OCRv4_det_infer.onnx
    
    paddle2onnx --model_dir /mnt/d/Downloads/202406/paddelocr/pp/ch_PP-OCRv4_rec_infer/ --model_filename inference.pdmodel --params_filename inference.pdiparams --opset_version 11 --save_file /mnt/d/Downloads/202406/paddelocr/onnx/ch_PP-OCRv4_rec_infer.onnx

     

     

步骤2: ONNX推理运行

转换格式成功后得到的ONNX模型可以进行推理。若要用于识别任务,还需补充输入图片的预处理和检测结果的输出等外围数据处理步骤。

https://github.com/jingsongliujing/OnnxOCR

该项目基于转换后的ppocr_server_v2.0模型,已经完成了文本识别所需的外围数据处理部分。

经过测试,pp_ocr系列模型的预处理和后处理部分是通用的。只需在此代码基础上集成转换好的ONNX模型即可。

https://github.com/CKboss/pp_onnx

这是基于原项目fork后的修改版,支持运行PP_OCRv4,并能调用v4版本的det和rec OCR模型。旋转检测部分的cls模型保持不变,仍使用server_v2.0版本。此外,还修改了可能导致引用冲突的包名和部分模型输入参数。

 

注:

转换为ONNX格式后的模型精度损失情况尚不明确,但从简单的demo来看,模型能够正常进行推理。

与将PaddleOCR 转为 ONNX 运行相似的内容:

将PaddleOCR 转为 ONNX 运行

PaddleOCR 是目前最好的开源OCR框架, 但paddle框架的兼容性实在不怎么好, 部署的时候容易出现各种各样的问题. 如果能把PaddleOCR转成ONNX, 就可以跳过paddle框架坑的同时, 又可以白嫖PaddleOCR的强大检测性能. 本文会介绍一下, 如何把最新的PP_OCRv4

OCR -- 文本识别 -- 实践篇

[OCR -- 文本识别 -- 理论篇](https://www.cnblogs.com/vipsoft/p/17445583.html) 本章将详细介绍如何基于PaddleOCR完成CRNN文本识别模型的搭建、训练、评估和预测。数据集采用 icdar 2015,其中训练集有4468张,测试集有20

将传统应用带入浏览器的开源先锋「GitHub 热点速览」

现代浏览器已经不再是简单的浏览网页的工具,其潜能正在通过技术不断地被挖掘和扩展。得益于 WebAssembly 等技术的出现,让浏览器能够以接近原生的速度执行非 JavaScript 语言编写的程序,从而打开了浏览器的“潘多拉魔盒”。

将虚拟机跑在ceph之中

目录openStack对接ceph1. cinder对接ceph1.1 ceph创建存储池1.2 ceph授权1.3 下发ceph文件1.4 修改globals文件1.5 部署cinder1.6 创建卷null2. nova对接ceph2.1 创建卷2.2 更新cinder权限2.3 修改globa

将强化学习重新引入 RLHF

我们很高兴在 TRL 中介绍 RLOO (REINFORCE Leave One-Out) 训练器。作为一种替代 PPO 的方法,RLOO 是一种新的在线 RLHF 训练算法,旨在使其更易于访问和实施。特别是, RLOO 需要的 GPU 内存更少,并且达到收敛所需的挂钟时间也更短。如下面的图表所示:

将html页面转成pdf下载保存(html2canvas + jspdf或者Print调出打印功能导出pdf)

方案1:html2canvas + jspdf (缺点:清晰度不高) 安装插件: 亲测可用 yarn add html2canvas yarn add jspdf import html2canvas from 'html2canvas'; import jspdf from 'jspdf'; /*

Qt-qrencode开发-生成、显示二维码

将qrencode使用Qt封装为一个生成、显示二维码的控件; 支持使用QPainter绘制显示二维码; 可通过函数接口返回生成的二维码QImage; 可通过调用函数将生成的二维码保存到指定路径; 支持使用源码嵌入工程(更好的跨平台、支持各种编译器); 支持使用编译好的静态库(MSVC2017-64)...

springboot~封装依赖引用包jar还是pom,哪种更规范

将多个第三方包封装成一个项目后,如果你的目的是让其他开发人员可以直接引用这些依赖,一般来说有两种常见的方式: 打成JAR包:将封装好的项目编译打包成JAR文件,其他开发人员可以将这个JAR文件添加到他们的项目中,并在项目的构建工具(比如Maven)中配置该JAR作为依赖。这样做的好处是简单直接,其他

将编译过的C++库迅速部署在Visual Studio新项目中

本文介绍在Visual Studio中,通过属性表,使得一个新建解决方案中的项目可以快速配置已有解决方案的项目中各类已编译好的C++第三方库的方法~

将大量文件的拓展名中大写字母改为小写:Python实现

本文介绍基于Python语言,基于一个大文件夹,遍历其中的多个子文件夹,对于每一个子文件夹中的大量文件,批量将其文件的名称或后缀名中的字母由大写修改为小写的方法~