学会一招!如何利用 pandas 批量合并 Excel?

开发 后端
今天分享一个利用Pandas进行数据分析的小技巧,也是之前有粉丝在后台进行提问的,即如何将多个pandas.dataframe保存到同一个Excel中。

大家好,我是菜鸟哥!

其实只需要灵活使用pandas中的pd.ExcelWriter()方法即可!

假设现在我们有df1 df2 df3三个dataframe,需要将它们保存到同一个Excel的不同sheet中,只需要先创建一个ExcelWriter对象,然后不停写入就行

df1 = pd.read_csv('东京奥运会奖牌数据.csv')
df2 = pd.read_excel("TOP250.xlsx")
df3 = pd.read_excel("2020年中国大学排名.xlsx")
writer = pd.ExcelWriter('test.xlsx')
df1.to_excel(writer,sheet_name="df1",index=False)
df2.to_excel(writer,sheet_name="df2",index=False)
df3.to_excel(writer,sheet_name="df3",index=False)
writer.save()

是不是和常见的文件读写with方法类似,我们也可以使用同样的方法

with pd.ExcelWriter("test1.xlsx") as xlsxwriter:
df1.to_excel(xlsxwriter,sheet_name="df1",index=False)
df2.to_excel(xlsxwriter,sheet_name="df2",index=False)
df3.to_excel(xlsxwriter,sheet_name="df3",index=False)

得到的结果是一样的,可以将多个df保存到一个Excel中

这个方法虽然简单好用,但是如果要保存的 df 太多了,一个一个手动去读取再手动去保存就显得十分麻烦,另外我们希望sheet是文件名,如果手动复制粘贴,就更麻烦了。

这时,办公自动化系列的文章就发挥作用了,我们先简单拿来一个小脚本「获取指定目录下的全部Excel文件名」

import os
def getfile(dirpath):
filelist = []
for root,dirs,files in os.walk(dirpath):
for file in files:
if file.endswith("xlsx") or file.endswith("csv"):
filelist.append(os.path.join(root,file))
return filelist

执行一下,可以看到指定目录下的全部Excel文件名

下面要做的,我想不用多说了「循环读取,自动保存」

filelist = getfile('/Users/liuzaoqi/Desktop/zaoqi/2022公众号文章/如何保存多个df')
writer = pd.ExcelWriter('test.xlsx')
for file in filelist:
if file.endswith("xlsx"):
df = pd.read_excel(file)
else:
df = pd.read_csv(file)
df.to_excel(writer,sheet_name=file.split('/')[-1].split('.')[0],index=False)
writer.save()

现在,当前目录下的全部Excel就自动合并到一个Excel中的不同sheet中,并且sheet名是对应的文件名

如果你对本文的内容感兴趣,不妨拿走代码试一下。

责任编辑:庞桂玉 来源: 菜鸟学Python
相关推荐

2022-05-30 08:53:47

PycharmPython

2019-01-03 08:14:20

路由器系统后台网络

2021-10-08 08:58:35

MySQL函数脱敏

2018-12-19 13:33:24

Safari浏览器搜索

2012-02-01 15:41:42

2013-07-30 11:24:33

SAP“简化IT 一招

2021-11-22 11:30:37

JavaScript代码浏览器

2021-08-21 23:33:16

iOS苹果系统

2021-06-28 20:01:07

电脑性能Windows 7

2013-05-03 11:21:27

2022-09-06 11:53:00

开发计算

2011-04-19 09:47:14

2023-03-03 13:14:46

2020-10-29 06:02:44

PythonPandasExcel

2020-09-16 06:08:10

Linux文本比对代码

2009-02-20 10:09:00

网吧掉线路由器

2010-03-16 08:59:45

Windows 7纯净版安装

2018-11-30 16:17:28

HTTPS

2011-05-03 11:13:51

黑盒

2020-06-22 14:18:02

运维架构技术
点赞
收藏

51CTO技术栈公众号