RapidOCR文字图像识别

Reset the brain 2024-08-12 10:35:02 阅读 89

RapidOCR

一、简介

RapidOCR 是由RapidAI开发的一款强大且高效的光学字符识别(Optical Character Recognition, OCR)引擎,旨在提供快速、精准的文字提取服务。通过这款开源项目,开发者可以轻松地将OCR功能集成到自己的应用中,无论是移动应用还是Web平台,都能实现文本自动识别和处理。它可以将图像中的文本转换为可编辑的文本或数字格式。

优点:

1、支持多语言(英文、中文等等)识别

2、支持多语言开发(Java、python等等),便于集成

二、使用流程

前提:导入依赖

<code><!-- rapidocr这个必须要引入 -->

<!-- 可前往maven中央仓库https://repo1.maven.org/maven2/io/github/mymonstercat/rapidocr/,查看版本 -->

<dependency>

<groupId>io.github.mymonstercat</groupId>

<artifactId>rapidocr</artifactId>

<version>0.0.7</version>

</dependency>

<!-- 一般只需要引入一个,CPU端建议使用onnx,移动端建议使用ncnn -->

<!-- 可前往maven中央仓库https://repo1.maven.org/maven2/io/github/mymonstercat/,查看版本 -->

<dependency>

<groupId>io.github.mymonstercat</groupId>

<artifactId>rapidocr-onnx-platform</artifactId>

<version>0.0.7</version>

</dependency>

<dependency>

<groupId>io.github.mymonstercat</groupId>

<artifactId>rapidocr-ncnn-platform</artifactId>

<version>0.0.7</version>

</dependency>

图片格式可以是jpg、jpeg。。。。但不可以是gif,以下方法只支持解析静态图

public static void main(String[] args) {

//调用模型方法

InferenceEngine engine = InferenceEngine.getInstance(Model.ONNX_PPOCR_V3);

//填写图片路径

OcrResult ocrResult = engine.runOcr("C:\\Users\\22593\\Desktop\\Life\\BG-image\\u=341785441,4290979397&fm=253&app=120&size=w931&n=0&f=JPEG&fmt=auto.webp");

System.out.println("============");

System.out.println(ocrResult.getStrRes().trim());

}

调用的方法入参一定是 单个图片路径 !!!因为runOcr方法内是String类型的入参

要输出的图片路径不能是中文名,不然会乱码

例子

正常输出图片中内容

输出的内容与日志打印的内容一致

如果图像中没有文字则不返回该字段

输出内容简解析



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。