Python|如何正确安装PaddleOCR

前言

工作上,我们遇到需要识别图文的项目,脑海中想到的第一个估计都会是OCR。不得不说,有很多识别精准的OCR库,但部分是需要收费的。而小编这里推荐的是python提供的一款免费而且识别率很高的一个第三方库paddleocr。

安装

首先,需要安装paddleocr,直接在终端输入如下命令

pip install paddleocr

如果你一步安装成功,恭喜你,下面的安装内容你可以省略了。

但一般情况,会出现下面的报错。

没错,就是Running setup.py install for python-Levenshtein … error。那现在,要怎么解决呢?方法如下:
 https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

 点击上方链接,下载对应python_Levenshtein版本的whl文件

 将下载好的whl文件放在你想要保存的目录下,并复制它的绝对路径,使用如下命令进行安装:

pip install D:\pycharm\python_Levenshtein-0.12.2-cp37-cp37m-win_amd64.whl

需要注意的一点是,这里cp指的是python的版本,我使用的python版本是3.7这个版本,下载过高版本会导致报错。运行上述pip命令之后,如下图:

重点

上述命令,都成功之后,接下来就是最后一步,我们再一次安装paddleocr,在终端输入命令:

pip install paddleocr

点击回车键,运行之后,你会看到如下结果,表明我们将paddleocr安装成功。

 测试

下面,测试一段paddleocr的使用代码,来识别下面这种图的信息

from paddleocr import PaddleOCR, draw_ocr

ocr = PaddleOCR(use_angle_cls=True, use_gpu=False)
img_path = r'C:\Users\Administrator.PC-201704222111\Desktop\66.png'
result = ocr.ocr(img_path, cls=True)
for line in result:
    print(line)

 运行之后,果然出现一些小问题,

缺少paddle,那我们就

pip install paddle

一句话,缺什么就补什么

再次运行代码,出现ImportError: cannot import name  _registerMatType  from  cv2.cv2,直接使用如下命令

# 执行第1条
pip uninstall opencv-python-headless

# 再执行第2条
pip install opencv-python-headless==4.1.2.30

再一次运行代码的时候,又出现ImportError: cannot import name  inference  from  paddle,使用如下命令

python -m  pip install paddlepaddle==2.0.1 -i https://mirror.baidu.com/pypi/simple

接着再次运行代码,这一次终于成功了,如下:

最后,我们就可以正常使用paddleocr了。

如果喜欢本文或者本文对你有帮助的话,记得关注小编并点个赞哟,有问题和需求欢迎留言私信。

Python|将PDF文件批量转成Word文件 

来源:写python的鑫哥

物联沃分享整理
物联沃-IOTWORD物联网 » Python|如何正确安装PaddleOCR

发表评论