发布于2021-07-25 06:58 阅读(534) 评论(0) 点赞(19) 收藏(4)
上一篇提到用python-docx读写.docx文章,但该模块并不能读取.doc文档,这里使用win32com模块,更高级,可以操作word,excel等office文档
方法一:官网下载对应python版本的安装程序,网址为:https://sourceforge.net/projects/pywin32/files/pywin32/,下载完成后,双击安装即可
方法二:
pip install pywin32
AttributeError: module 'win32com' has no attribute 'client'
解决:改变导包方式 from win32com import client后可正常执行
- from win32com.client import Dispatch
- word = Dispatch('Word.Application') # 打开word应用程序
- # word = DispatchEx('Word.Application') # 启动独立的进程
- word.Visible = 0 # 后台运行,不显示
- word.DisplayAlerts = 0 # 不警告
-
- path = r'D:\test\1.doc' # 'D:\test\1.docx'
- doc = word.Documents.Open(FileName=path, Encoding='gbk')
-
- for para in doc.paragraphs:
- print(para)
-
- doc.Close()
- word.Quit()
1.doc的文档内容如下:
输出结果如下:
- from win32com.client import Dispatch
-
- word = Dispatch('Word.Application') # 打开word应用程序
- # word = DispatchEx('Word.Application') # 启动独立的进程
- word.Visible = 0 # 后台运行,不显示
- word.DisplayAlerts = 0 # 不警告
-
- doc = word.Documents.Open(r'D:\test\1.doc')
- doc.SaveAs(r"D:\test\2.docx", 12) # 另存为后缀为".docx"的文件,其中参数12指doc文件
- doc.Close()
- word.Quit()
原文链接:https://blog.csdn.net/qq_40006760/article/details/119024320
作者:我想吃麻辣烫
链接:http://www.pythonpdf.com/blog/article/450/d0a240245bc295b1d738/
来源:编程知识网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!