使用Python自动化Microsoft Excel和Word

开发 后端 自动化
毫无疑问,微软的Excel和Word是公司和非公司领域使用最广泛的两款软件。它们实际上是“工作”的同义词。

通常情况下,每一周我们都会将两者结合起来,并以某种方式发挥它们的优点。虽然一般的日常用途不会要求自动化,但有时自动化可能是必需的。也就是说,当您有大量的图表、图形、表格和报告要生成时,如果您选择手动方式,它可能会成为一项极其繁琐的工作。其实没必要这样。实际上,有一种方法可以在Python中创建一个管道,您可以将两者无缝集成,在Excel中生成电子表格,然后将结果传输到Word中,几乎即时生成报告。

Openpyxl

Openpyxl它可以说是Python中最通用的包之一,它可以非常容易使用Excel接口。有了它,你可以读和写所有当前和最早的excel格式,即xlsx和xls。Openpyxl允许您填充行和列、执行公式、创建2D和3D图表、标记轴和标题,以及其他许多非常有用的功能。然而,最重要的是,这个包允许您在Excel中遍历无穷多的行和列,从而避免了之前必须做的所有烦人的数字处理和绘图。

Python-docx

然后是Python-docx,这个包之于Word就像Openpyxl之于Excel。如果您还没有学习他们的文档,那么您可能应该看一看。毫不夸张地说,Python-docx是我开始使用Python以来使用过的最简单、最不言自明的工具包之一。它允许您通过插入文本、填充表格和在报表中自动渲染图像来自动生成文档。

言归正传,让我们创建我们自己的自动化流水线。继续使用Anaconda(或者你选择的任何其他IDE)并安装以下软件包:

 

  1. pip install openpyxl  
  2. pip install python-docx 

 

Microsoft Excel自动化

首先,我们将加载一个已经创建好的Excel工作簿(如下所示):

 

  1. workbook = xl.load_workbook('Book1.xlsx')  
  2. sheet_1 = workbook['Sheet1'

 

 

使用Python自动化Microsoft Excel和Word

 

随后,我们将遍历电子表格中的所有行,通过电流乘以电压来计算和插入功率值:

 

  1. for row in range(2, sheet_1.max_row + 1):  
  2. current = sheet_1.cell(row, 2)  
  3. voltage = sheet_1.cell(row, 3)  
  4. power = float(current.value) * float(voltage.value)  
  5. power_cell = sheet_1.cell(row, 1)  
  6. power_cell.value = power 

 

一旦完成,我们将使用计算的功率值生成折线图,将插入指定的单元格,如下图所示:

 

  1. values = Reference(sheet_1, min_row = 2, max_row = sheet_1.max_row, min_col = 1, max_col = 1)  
  2. chart = LineChart()  
  3. chart.y_axis.title = 'Power'  
  4. chart.x_axis.title = 'Index'  
  5. chart.add_data(values)  
  6. sheet_1.add_chart(chart, 'e2')  
  7. workbook.save('Book1.xlsx'

 

 

使用Python自动化Microsoft Excel和Word

 

现在我们已经生成了图表,我们需要将其提取为图像,以便在Word报告中使用它。首先,我们将确定Excel文件的确切位置,以及输出的图表图像应该保存的位置:

 

  1. input_file = "C:/Users/.../Book1.xlsx"  
  2. output_image = "C:/Users/.../chart.png" 

 

然后使用以下方法访问电子表格:

 

  1. operation = win32com.client.Dispatch("Excel.Application")  
  2. operation.Visible = 0  
  3. operation.DisplayAlerts = 0  
  4. workbook_2 = operation.Workbooks.Open(input_file)  
  5. sheet_2 = operation.Sheets(1) 

 

你可以迭代电子表格中的所有图表对象(如果有一个以上),并将它们保存在指定的位置如下:

 

  1. for x, chart in enumerate(sheet_2.Shapes):  
  2. chart.Copy()  
  3. image = ImageGrab.grabclipboard()  
  4. image.save(output_image, 'png')  
  5. passworkbook_2.Close(True)  
  6. operation.Quit() 

 

Microsoft Word自动化

现在我们已经生成了图表图像,我们必须创建一个模板文档,它基本上是一个普通的Microsoft Word文档(.docx),它完全按照我们希望的报告外观来制定,包括字体、字体大小、格式和页面结构。然后,我们需要做的就是为我们的自动内容创建占位符,即表值和图像,并使用变量名声明它们,如下所示。

 

使用Python自动化Microsoft Excel和Word

 

任何自动的内容都可以在双花括号{{variable_name}}中声明,包括文本和图像。对于表,你需要创建一个包含所有列的模板行表,然后你需要在上面加上一行,下面加上一行,符号如下:

第一行:

 

  1. {%tr for item in variable_name %} 

最后一行:

 

  1. {%tr endfor %} 

在上图中,变量名是:

  1. table_contents用于存储表格数据的Python字典
  2. 字典键的索引(第一列)
  3. 字典值的功率、电流和电压(第二、第三和第四列)

然后我们将模板文档导入Python,并创建一个字典来存储表中的值:

 

  1. template = DocxTemplate('template.docx')  
  2. table_contents = []for i in range(2, sheet_1.max_row + 1):  
  3. table_contents.append({  
  4. 'Index': i-1,  
  5. 'Power': sheet_1.cell(i, 1).value,  
  6. 'Current': sheet_1.cell(i, 2).value,  
  7. 'Voltage': sheet_1.cell(i, 3).value  
  8. }) 

 

接下来,我们将导入之前由Excel生成的图表图像,并创建另一个字典来实例化模板文档中声明的所有占位符变量:

 

  1. image = InlineImage(template,'chart.png',Cm(10))context = {  
  2. 'title''Automated Report',  
  3. 'day': datetime.datetime.now().strftime('%d'),  
  4. 'month': datetime.datetime.now().strftime('%b'),  
  5. 'year': datetime.datetime.now().strftime('%Y'),  
  6. 'table_contents': table_contents,  
  7. 'image': image  

 

最后,我们将用我们的值表和图表图像渲染报告:

 

  1. template.render(context)  
  2. template.save('Automated_report.docx'

 

结果

好了,这就是一个自动生成的Microsoft Word报告,包含数字和在Microsoft Excel中创建的图表。这样你就有了一个完全自动化的管道,可以用来创建尽可能多的表格、图表和文档。

 

使用Python自动化Microsoft Excel和Word

 

 

最后,完整的代码在这里:github/mkhorasani/excelwordautomation 有兴趣的可以下载修改和执行

 

责任编辑:华轩 来源: 今日头条
相关推荐

2020-04-21 10:45:47

PythonWordExcel

2021-12-28 09:24:49

Python邮件Word

2023-10-18 13:57:17

2022-03-21 10:09:08

PythonExcel邮件

2020-11-05 12:56:19

Python办公自动化

2021-04-19 14:00:03

ExchangelibPython邮箱自动化管理

2024-11-21 15:24:49

2021-12-14 07:40:08

Excel自动化办公

2024-05-29 11:16:33

PythonExcel

2022-07-05 08:26:10

Python报表自动化邮箱

2021-10-14 09:55:28

AnsibleanacronLinux

2021-05-06 13:45:13

PythonExce弹窗

2017-12-17 21:58:18

2022-03-30 09:43:19

jscodeshif自动化重构开发

2024-06-11 10:41:14

2013-03-22 15:15:28

自动化管理部署虚拟化

2021-09-17 15:56:14

数据平台自动化

2021-07-04 12:44:04

PythonExcel身份证

2021-07-14 13:11:02

papermillJupyterPython

2024-06-17 10:34:12

点赞
收藏

51CTO技术栈公众号