首先安装anaconda,详细流程:直接在其官网下载即可直接默认安装即可。
然后进入anaconda的prompt窗口
在该窗口中创建paddle的虚拟环境,python版本为3.7,详细流程:直接在窗口中输入该命令语句即可conda create --name paddle python=3.7
创建好虚拟环境后,通过activate激活环境
如何进入百度飞浆的官网
根据本机的CUDA版本进行选择,可以选择比自己版本低的。CUDA的版本查看详细步骤如下。
本机CUDA版本为11.3
因此根据本机CUDA版本选择了低版本的CUDA10.2进行安装
安装步骤是直接将该命令复制到刚刚激活paddle环境的命令框中
安装完成后,输入python进入编译环境
然后输入import paddle
再输入paddle.utils.run_check()进行验证是否安装成功
如果出现successfully则表明安装成功
输入exit()退出编译环境
接下来安装paddleocr,首先在github上搜索paddleOCR
选择被收藏最多的
然后进行下载
下载完成后将其解压
然后在命令窗口中将访问路径设置为当前路径,详细步骤,直接输入当前路径磁盘名F:进行跳转
再输入cd+当前路径即可跳转
跳转完成后通过pip inastall -r requirements.txt安装PaddleOCR需要依赖库
安装完成后如图所示
再通过python setup.py install安装PaddleOCR
安装完成后,我们直接进入pycharm,创建一个测试程序
import cv2
from paddleocr import PPStructure,draw_structure_result,save_structure_res
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
table_engine = PPStructure(show_log=True)
save_folder = 'output'
img_path = 'photo/table1.png'
img = cv2.imread(img_path)
result = table_engine(img)
save_structure_res(result, save_folder,os.path.basename(img_path).split('.')[0])
for line in result:
line.pop('img')
print(line)
from PIL import Image
font_path = '../doc/fonts/simfang.ttf' # PaddleOCR下提供字体包
image = Image.open(img_path).convert('RGB')
im_show = draw_structure_result(image, result,font_path=font_path)
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
可以发现导入paddle库时报错,这是因为pycharm还没有切换环境造成的
切换环境的详细步骤:首先进入设置
然后进入项目
进入解释器
点击添加环境
选择conda环境
选择当前环境
浏览环境位置
Paddle的环境是按照在anaconda的虚拟环境中的
选择paddle环境文件夹中的python文件即可
然后点击确定
然后在点击应用后确定操作
导入环境后便不再报错
然后创建两个文件夹用于放置输出的结果和识别的图片,详细步骤:首先点击项目右键
选择新建文件夹
然后将其命名为output
同样的步骤创建photo文件夹
可将根目录下的图片直接拖到photo文件夹中即可。
然后将程序中的输出文件的保存路径进行替换
保存路径可以通过右键output文件夹,选择复制路径
复制相对路径
然后将保存路径进行替换
图片路径也是相同的操作进行替换
然后检测测试程序发现缺少字体文件
该文件在paddleOCR中
直接将该文件夹复制到程序根目录即可
运行程序后发现缺少layoutparser库
然后进入paddle的命令窗口进行安装即可,安装命令为
pip3 install -U https://paddleocr.bj.bcebos/whl/layoutparser-0.0.0-py3-none-any.whl
然后pycharm会自动更新运行环境的变动
然后重新运行程序出现了OMP报错
该错误是因为运行核死亡导致的,只需要添加
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
程序编译运行,即识别完成输出了一个excel文件
对比图片识别的效果很不错
更多推荐
windows10通过anaconda安装paddle和paddleOCR并将图片转为excel
发布评论