ONNX格式模型 学习笔记 (onnxRuntime部署)---用java调用yolov8模型来举例

天宇2323 2024-06-26 11:35:03 阅读 94

ONNX(Open Neural Network Exchange)是一个开源项目,旨在建立一个开放的标准,使深度学习模型可以在不同的软件平台和工具之间轻松移动和重用

ONNX模型可以用于各种应用场景,例如机器翻译、图像识别、语音识别、自然语言处理等。

由于ONNX模型的互操作性,开发人员可以使用不同的框架来训练,模型可以更容易地在不同的框架之间转换,例如从PyTorch转换到TensorFlow,或从TensorFlow转换到MXNet等。然后将其部署到不同的环境中,例如云端、边缘设备或移动设备等。

ONNX还提供了一组工具和库,帮助开发人员更容易地创建、训练和部署深度学习模型。

ONNX模型是由多个节点(node)组成的图(graph),每个节点代表一个操作或一个张量(tensor)。ONNX模型还包含了一些元数据,例如模型的版本、输入和输出张量的名称等。

onnx官网

ONNX | Home

pytorch官方使用onnx模型格式举例

(optional) Exporting a Model from PyTorch to ONNX and Running it using ONNX Runtime — PyTorch Tutorials 2.2.0+cu121 documentation

TensorFlow官方使用onnx模型格式举例

https://github.com/onnx/tutorials/blob/master/tutorials/TensorflowToOnnx-1.ipynb

Netron可视化模型结构工具

Netron

你可通过该工具看到onnx具体的模型结构,点击每层都能看到其对应的内容信息

onnxRuntime  | 提供各种编程语言推导onnx格式模型的接口

ONNX Runtime | Home

比如我需要在java环境下调用一个onnx模型,我可以先导入onnxRuntime的依赖,对数据预处理后,调用onnx格式模型正向传播导出数据,然后将数据处理成我要的数据。 

onnxRuntime也提供了其他编程语言的接口,如C++、C#、JavaScript、python等等。

实际案例举例

python部分

python下利用ultralytics从网上下载并导出yolov8的onnx格式模型,用java调用onnxruntim接口,正向传播推导模型数据。

pip install ultralytics

from ultralytics import YOLO

# 加载模型

model = YOLO('yolov8n.pt') # 加载官方模型

#加载自定义训练的模型

#model = YOLO('F:\\File\\AI\\Object\\yolov8_test\\runs\\detect\\train\\weights\\best.pt')

# 导出模型

model.export(format='onnx')

java部分

前提安装java的opencv(Get Started - OpenCV),我这安装的是opencv480

maven依赖

<dependencies>

<dependency>

<groupId>com.microsoft.onnxruntime</groupId>

<artifactId>onnxruntime</artifactId>

<version>1.12.0</version>

</dependency>

<!-- 加载lib目录下的opencv包 -->

<dependency>

<groupId>org.opencv</groupId>

<artifactId>opencv</artifactId>

<version>4.8.0</version>

<scope>system</scope>

<!--通过路径加载OpenCV480的jar包-->

<systemPath>${basedir}/lib/opencv-480.jar</systemPath>

</dependency>

<dependency>

<groupId>com.alibaba</groupId>

<artifactId>fastjson</artifactId>

<version>2.0.32</version>

</dependency>

</dependencies>

java完整代码

package com.sky;

//天宇 2023/12/21 20:23:13

import ai.onnxruntime.*;

import com.alibaba.fastjson.JSONObject;

import org.opencv.core.*;

import org.opencv.core.Point;

import org.opencv.highgui.HighGui;

import org.opencv.imgcodecs.Imgcodecs;

import org.opencv.imgproc.Imgproc;

import java.nio.FloatBuffer;

import java.text.DecimalFormat;

import java.util.*;

import java.util.List;

/**

* onnx学习笔记 GTianyu

*/

public class onnxLoadTest01 {

public static OrtEnvironment env;

public static OrtSession session;

public static JSONObject names;

public static long count;

public static long channels;

public static long netHeight;

public static long netWidth;

public static float srcw;

public static float srch;

public static float confThreshold = 0.25f;

public static float nmsThreshold = 0.5f;

static Mat src;

public static void load(String path) {

String weight = path;

try{

env = OrtEnvironment.getEnvironment();

session = env.createSession(weight, new OrtSession.SessionOptions());

OnnxModelMetadata metadata = session.getMetadata();

Map<String, NodeInfo> infoMap = session.getInputInfo();

TensorInfo nodeInfo = (TensorInfo)infoMap.get("images").getInfo();

String nameClass = metadata.getCustomMetadata().get("names");

System.out.println("getProducerName="+metadata.getProducerName());

System.out.println("getGraphName="+metadata.getGraphName());

System.out.println("getDescription="+metadata.getDescription());

System.out.println("getDomain="+metadata.getDomain());

System.out.println("getVersion="+metadata.getVersion());

System.out.println("getCustomMetadata="+metadata.getCustomMetadata());

System.out.println("getInputInfo="+infoMap);

System.out.println("nodeInfo="+nodeInfo);

System.out.println(nameClass);

names = JSONObject.parseObject(nameClass.replace("\"","\"\""));

count = nodeInfo.getShape()[0];//1 模型每次处理一张图片

channels = nodeInfo.getShape()[1];//3 模型通道数

netHeight = nodeInfo.getShape()[2];//640 模型高

netWidth = nodeInfo.getShape()[3];//640 模型宽

System.out.println(names.get(0));

// 加载opencc需要的动态库

System.loadLibrary(Core.NATIVE_LIBRARY_NAME);

}

catch (Exception e){

e.printStackTrace();

System.exit(0);

}

}

public static Map<Object, Object> predict(String imgPath) throws Exception {

src=Imgcodecs.imread(imgPath);

return predictor();

}

public static Map<Object, Object> predict(Mat mat) throws Exception {

src=mat;

return predictor();

}

public static OnnxTensor transferTensor(Mat dst){

Imgproc.cvtColor(dst, dst, Imgproc.COLOR_BGR2RGB);

dst.convertTo(dst, CvType.CV_32FC1, 1. / 255);

float[] whc = new float[ Long.valueOf(channels).intValue() * Long.valueOf(netWidth).intValue() * Long.valueOf(netHeight).intValue() ];

dst.get(0, 0, whc);

float[] chw = whc2cwh(whc);

OnnxTensor tensor = null;

try {

tensor = OnnxTensor.createTensor(env, FloatBuffer.wrap(chw), new long[]{count,channels,netWidth,netHeight});

}

catch (Exception e){

e.printStackTrace();

System.exit(0);

}

return tensor;

}

//宽 高 类型 to 类 宽 高

public static float[] whc2cwh(float[] src) {

float[] chw = new float[src.length];

int j = 0;

for (int ch = 0; ch < 3; ++ch) {

for (int i = ch; i < src.length; i += 3) {

chw[j] = src[i];

j++;

}

}

return chw;

}

public static Map<Object, Object> predictor() throws Exception{

srcw = src.width();

srch = src.height();

System.out.println("width:"+srcw+" hight:"+srch);

System.out.println("resize: \n width:"+netWidth+" hight:"+netHeight);

float scaleW=srcw/netWidth;

float scaleH=srch/netHeight;

// resize

Mat dst=new Mat();

Imgproc.resize(src, dst, new Size(netWidth, netHeight));

// 转换成Tensor数据格式

OnnxTensor tensor = transferTensor(dst);

OrtSession.Result result = session.run(Collections.singletonMap("images", tensor));

System.out.println("res Data: "+result.get(0));

OnnxTensor res = (OnnxTensor)result.get(0);

float[][][] dataRes = (float[][][])res.getValue();

float[][] data = dataRes[0];

// 将矩阵转置

// 先将xywh部分转置

float rawData[][]=new float[data[0].length][6];

System.out.println(data.length-1);

for(int i=0;i<4;i++){

for(int j=0;j<data[0].length;j++){

rawData[j][i]=data[i][j];

}

}

// 保存每个检查框置信值最高的类型置信值和该类型下标

for(int i=0;i<data[0].length;i++){

for(int j=4;j<data.length;j++){

if(rawData[i][4]<data[j][i]){

rawData[i][4]=data[j][i]; //置信值

rawData[i][5]=j-4; //类型编号

}

}

}

List<ArrayList<Float>> boxes=new LinkedList<ArrayList<Float>>();

ArrayList<Float> box=null;

// 置信值过滤,xywh转xyxy

for(float[] d:rawData){

// 置信值过滤

if(d[4]>confThreshold){

// xywh(xy为中心点)转xyxy

d[0]=d[0]-d[2]/2;

d[1]=d[1]-d[3]/2;

d[2]=d[0]+d[2];

d[3]=d[1]+d[3];

// 置信值符合的进行插入法排序保存

box=new ArrayList<Float>();

for(float num:d) {

box.add(num);

}

if(boxes.size()==0){

boxes.add(box);

}else {

int i;

for(i=0;i<boxes.size();i++){

if(box.get(4)>boxes.get(i).get(4)){

boxes.add(i,box);

break;

}

}

// 插入到最后

if(i==boxes.size()){

boxes.add(box);

}

}

}

}

// 每个框分别有x1、x1、x2、y2、conf、class

//System.out.println(boxes);

// 非极大值抑制

int[] indexs=new int[boxes.size()];

Arrays.fill(indexs,1); //用于标记1保留,0删除

for(int cur=0;cur<boxes.size();cur++){

if(indexs[cur]==0){

continue;

}

ArrayList<Float> curMaxConf=boxes.get(cur); //当前框代表该类置信值最大的框

for(int i=cur+1;i<boxes.size();i++){

if(indexs[i]==0){

continue;

}

float classIndex=boxes.get(i).get(5);

// 两个检测框都检测到同一类数据,通过iou来判断是否检测到同一目标,这就是非极大值抑制

if(classIndex==curMaxConf.get(5)){

float x1=curMaxConf.get(0);

float y1=curMaxConf.get(1);

float x2=curMaxConf.get(2);

float y2=curMaxConf.get(3);

float x3=boxes.get(i).get(0);

float y3=boxes.get(i).get(1);

float x4=boxes.get(i).get(2);

float y4=boxes.get(i).get(3);

//将几种不相交的情况排除。提示:x1y1、x2y2、x3y3、x4y4对应两框的左上角和右下角

if(x1>x4||x2<x3||y1>y4||y2<y3){

continue;

}

// 两个矩形的交集面积

float intersectionWidth =Math.max(x1, x3) - Math.min(x2, x4);

float intersectionHeight=Math.max(y1, y3) - Math.min(y2, y4);

float intersectionArea =Math.max(0,intersectionWidth * intersectionHeight);

// 两个矩形的并集面积

float unionArea = (x2-x1)*(y2-y1)+(x4-x3)*(y4-y3)-intersectionArea;

// 计算IoU

float iou = intersectionArea / unionArea;

// 对交并比超过阈值的标记

indexs[i]=iou>nmsThreshold?0:1;

//System.out.println(cur+" "+i+" class"+curMaxConf.get(5)+" "+classIndex+" u:"+unionArea+" i:"+intersectionArea+" iou:"+ iou);

}

}

}

List<ArrayList<Float>> resBoxes=new LinkedList<ArrayList<Float>>();

for(int index=0;index<indexs.length;index++){

if(indexs[index]==1) {

resBoxes.add(boxes.get(index));

}

}

boxes=resBoxes;

System.out.println("boxes.size : "+boxes.size());

for(ArrayList<Float> box1:boxes){

box1.set(0,box1.get(0)*scaleW);

box1.set(1,box1.get(1)*scaleH);

box1.set(2,box1.get(2)*scaleW);

box1.set(3,box1.get(3)*scaleH);

}

System.out.println("boxes: "+boxes);

//detect(boxes);

Map<Object,Object> map=new HashMap<Object,Object>();

map.put("boxes",boxes);

map.put("classNames",names);

return map;

}

public static Mat showDetect(Map<Object,Object> map){

List<ArrayList<Float>> boxes=(List<ArrayList<Float>>)map.get("boxes");

JSONObject names=(JSONObject) map.get("classNames");

Imgproc.resize(src,src,new Size(srcw,srch));

// 画框,加数据

for(ArrayList<Float> box:boxes){

float x1=box.get(0);

float y1=box.get(1);

float x2=box.get(2);

float y2=box.get(3);

float config=box.get(4);

String className=(String)names.get((int)box.get(5).intValue());;

Point point1=new Point(x1,y1);

Point point2=new Point(x2,y2);

Imgproc.rectangle(src,point1,point2,new Scalar(0,0,255),2);

String conf=new DecimalFormat("#.###").format(config);

Imgproc.putText(src,className+" "+conf,new Point(x1,y1-5),0,0.5,new Scalar(255,0,0),1);

}

HighGui.imshow("image",src);

HighGui.waitKey();

return src;

}

public static void main(String[] args) throws Exception {

String modelPath="C:\\Users\\tianyu\\IdeaProjects\\test1\\src\\main\\java\\com\\sky\\best.onnx";

String path="C:\\Users\\tianyu\\IdeaProjects\\test1\\src\\main\\resources\\img\\img.png";

onnxLoadTest01.load(modelPath);

Map<Object,Object> map=onnxLoadTest01.predict(path);

showDetect(map);

}

}

效果:

参考文献:

使用 java-onnx 部署 yolovx 目标检测_java onnx-CSDN博客



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。