RapidOCR文字图像识别
Reset the brain 2024-08-12 10:35:02 阅读 89
RapidOCR
一、简介
RapidOCR 是由RapidAI开发的一款强大且高效的光学字符识别(Optical Character Recognition, OCR)引擎,旨在提供快速、精准的文字提取服务。通过这款开源项目,开发者可以轻松地将OCR功能集成到自己的应用中,无论是移动应用还是Web平台,都能实现文本自动识别和处理。它可以将图像中的文本转换为可编辑的文本或数字格式。
优点:
1、支持多语言(英文、中文等等)识别
2、支持多语言开发(Java、python等等),便于集成
二、使用流程
前提:导入依赖
<code><!-- rapidocr这个必须要引入 -->
<!-- 可前往maven中央仓库https://repo1.maven.org/maven2/io/github/mymonstercat/rapidocr/,查看版本 -->
<dependency>
<groupId>io.github.mymonstercat</groupId>
<artifactId>rapidocr</artifactId>
<version>0.0.7</version>
</dependency>
<!-- 一般只需要引入一个,CPU端建议使用onnx,移动端建议使用ncnn -->
<!-- 可前往maven中央仓库https://repo1.maven.org/maven2/io/github/mymonstercat/,查看版本 -->
<dependency>
<groupId>io.github.mymonstercat</groupId>
<artifactId>rapidocr-onnx-platform</artifactId>
<version>0.0.7</version>
</dependency>
<dependency>
<groupId>io.github.mymonstercat</groupId>
<artifactId>rapidocr-ncnn-platform</artifactId>
<version>0.0.7</version>
</dependency>
图片格式可以是jpg、jpeg。。。。但不可以是gif,以下方法只支持解析静态图
public static void main(String[] args) {
//调用模型方法
InferenceEngine engine = InferenceEngine.getInstance(Model.ONNX_PPOCR_V3);
//填写图片路径
OcrResult ocrResult = engine.runOcr("C:\\Users\\22593\\Desktop\\Life\\BG-image\\u=341785441,4290979397&fm=253&app=120&size=w931&n=0&f=JPEG&fmt=auto.webp");
System.out.println("============");
System.out.println(ocrResult.getStrRes().trim());
}
调用的方法入参一定是 单个图片路径 !!!因为runOcr方法内是String类型的入参
要输出的图片路径不能是中文名,不然会乱码
例子
正常输出图片中内容
输出的内容与日志打印的内容一致
如果图像中没有文字则不返回该字段
输出内容简解析
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。