使用paddleOCR对图片中的文字进行提取(安装过程+示例代码)

paddleOCR使用记录。

一、 paddleOCR运行环境

  1. python必备

  2. CUDA+cudnn+TensorRT请根据自身硬件情况进行安装,网上教程很多,请自行搜索,安装前请前往飞桨官网查看具体软件版本要求。https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html

  3. 安装padlepadle
    官网的教程很详细,请自行安装。

二、 paddleOCR 安装

使用pip install paddlepaddle paddleocr 命令安装即可

三、 我的相关环境配置

Windows 10 RTX 3060Ti

Python 3.8

CUDA 11.7

cuDNN v8.4.1

TensorRT8.4.2.4

四、 示例代码

from paddleocr import PaddleOCR, draw_ocr

# 创建OCR识别器
ocr = PaddleOCR(use_angle_cls=True,lang='ch')

# 读取图像
img_path = 'test.jpg'
# 进行文字识别
result = ocr.ocr(img_path, cls=True)

for idx in range(len(result)):
    res = result[idx]
    for line in res:
        print(line[1][0])  #line[1][1]为置信度,参数详细信息请参阅官方文档

test.jpg

test.jpg

输出结果:

result

五、 paddleOCR 项目官方网址

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.7/doc/doc_ch/quickstart.md#2

PS:官方文档对于门外汉还是复杂了点,对作者来说,我只想知道怎么输入,以及怎么得到我输出的结果就好了,其他技术性的东西我并不关心。。。。