微慑信息网

python操作word文档-vulsee.com

安装

pip install python-docx

 

测试

def dealDocxFile(fileName,keyword):
	doc = docx.Document(fileName)
	print len(doc.paragraphs)
	for num in range(len(doc.paragraphs)):
		if doc.paragraphs[num].text.find(keyword)>=0:
			print '发现关键字:%s ,在第 %d 行' %(keyword,num)
		
def main():
	print '开始:\n------------'
	fileName='./14FP-SZ-052.docx'
	keyword='深圳分行'
	dealDocxFile(fileName,keyword)
	print '\n------------\n结束.'

if __name__ == '__main__':
	main()

但这种办法对于在表格中的数据,无法读取到

如果需要处理文档中的表格,

需要:

def dealDocxFile1(fileName,keyword):
	doc = docx.Document(fileName)

	tb=doc.tables[1]
	
	for i in tb.rows:
		for j in i.cells:
			print j.text

 

 

参考

https://jingyan.baidu.com/article/03b2f78cd875115ea237aef0.html

https://python-docx.readthedocs.io/en/latest/api/table.html

https://www.cnblogs.com/klb561/p/10214195.html

 

其他库

欢迎使用python-docx-template的文档!

快速开始

要使用pip安装:

pip install docxtpl
或使用conda:

conda install docxtpl --channel conda-forge
用法:

from docxtpl import DocxTemplate

doc = DocxTemplate("my_word_template.docx")
context = { 'company_name' : "World company" }
doc.render(context)
doc.save("generated_doc.docx")

另外:python-docx 是docx的最新版

 

 

 

 

本文标题:python操作word文档-vulsee.com
本文链接:
(转载请附上本文链接)
http://vulsee.com/archives/vulsee_2021/0718_14696.html
转载请附本站链接,未经允许不得转载,,谢谢:微慑信息网-VulSee.com » python操作word文档-vulsee.com
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

微慑信息网 专注工匠精神

访问我们联系我们