目录

  • 1. 安装docx包
  • 2. 导入使用
  • 3.报错分析及解决方法
  • 4. 将word转化为txt文本
  • 5. docx模块的其他用法

1. 安装docx包

测试环境:Windows10,Python3.6.3 / Python3.8
命令如下:

pip3 install docx

安装成功截图:

2. 导入使用

安装完成后导入使用:

测试代码:

import docx


def docx_to_txt():
    # 打开文件
    file = docx.opendocx("./测试文件.docx")
    # 读取文本内容
    text = docx.getdocumenttext(file)
    # 打印输出到屏幕
    print(type(text), text)

# 调用函数
docx_to_txt()

会发现报错:

ModuleNotFoundError: No module named ‘exceptions’

3.报错分析及解决方法

报错分析:

说没有 exceptions 这个模块,由于Python3已经取消了这个模块,而 PendingDeprecationWarning 是内置
可以直接使用的,所以我们直接进入文件(根据你报错显示的路径):


然后把报错的第30行: from exceptions import PendingDeprecationWarning 注释掉,然后保存,就可以啦。

注释前:


注释后:

4. 将word转化为txt文本

再次运行测试代码,转化后得到的是一个列表格式的数据,然后根据自己的需求进行下一步处理或保存到文件。

5. docx模块的其他用法

word文档(docx)的读取和写入:docx模块

参考:https://blog.csdn/a649344475/article/details/81162381

更多推荐

Python将word转化为txt文本