万字长文记录Python读写EXCEL文件常用方法大全

开发 前端
python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式。

[[359430]]

 python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式。

  • 用xlrd和xlwt进行excel读写;
  • 用openpyxl进行excel读写;
  • 用pandas进行excel读写;

参考:

https://www.python-excel.org/

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html#pandas.read_excel

https://www.jianshu.com/p/19219542bf23

2|0数据准备

为了方便演示,我这里新建了一个data.xls和data.xlsx文件,第一个工作表sheet1区域“A1:E5”的内容如下,用于测试读写excel的代码:

万字长文记录Python读写EXCEL文件常用方法大全

3|0xlrd和xlwt

xlrd是一个库,用于从Excel文件中以.xls格式读取数据和格式化信息

xlwt是一个库,用于将数据和格式化信息写入较旧的Excel文件(例如:.xls)。

3|1示例

  1. pip install xlrd 
  2. pip install xlwt 

  

我们开始来读取文件的内容

  1. import xlrd 
  2. import os 
  3.  
  4. file_path = os.path.dirname(os.path.abspath(__file__)) 
  5. base_path = os.path.join(file_path, 'data.xlsx'
  6. book = xlrd.open_workbook(base_path) 
  7. sheet1 = book.sheets()[0] 
  8. nrows = sheet1.nrows 
  9. print('表格总行数', nrows) 
  10. ncols = sheet1.ncols 
  11. print('表格总列数', ncols) 
  12. row3_values = sheet1.row_values(2) 
  13. print('第3行值', row3_values) 
  14. col3_values = sheet1.col_values(2) 
  15. print('第3列值', col3_values) 
  16. cell_3_3 = sheet1.cell(2, 2).value 
  17. print('第3行第3列的单元格的值:', cell_3_3) 

  万字长文记录Python读写EXCEL文件常用方法大全

接下来我们来进行写入,写入可以进行的操作太多了,我这里只列举了常用的的操作。

  1. import xlwt 
  2. import datetime 
  3. # 创建一个workbook 设置编码 
  4. workbook = xlwt.Workbook(encoding='utf-8'
  5. # 创建一个worksheet 
  6. worksheet = workbook.add_sheet('Worksheet'
  7. # 写入excel参数对应 行, 列, 值 
  8. worksheet.write(0, 0, label='测试'
  9. # 设置单元格宽度 
  10. worksheet.col(0).width = 3333 
  11.  
  12. # 设置单元格高度 
  13. tall_style = xlwt.easyxf('font:height 520;'
  14. worksheet.row(0).set_style(tall_style) 
  15.  
  16. # 设置对齐方式 
  17. alignment = xlwt.Alignment()  # Create Alignment 
  18. # May be: HORZ_GENERAL, HORZ_LEFT, HORZ_CENTER, HORZ_RIGHT, HORZ_FILLED, HORZ_JUSTIFIED, HORZ_CENTER_ACROSS_SEL, HORZ_DISTRIBUTED 
  19. alignment.horz = xlwt.Alignment.HORZ_CENTER 
  20. # May be: VERT_TOP, VERT_CENTER, VERT_BOTTOM, VERT_JUSTIFIED, VERT_DISTRIBUTED 
  21. alignment.vert = xlwt.Alignment.VERT_CENTER 
  22. style = xlwt.XFStyle()  # Create Style 
  23. style.alignment = alignment  # Add Alignment to Style 
  24. worksheet.write(2, 0, '居中', style) 
  25.  
  26. # 写入带颜色背景的数据 
  27. pattern = xlwt.Pattern()  # Create the Pattern 
  28. # May be: NO_PATTERN, SOLID_PATTERN, or 0x00 through 0x12 
  29. pattern.pattern = xlwt.Pattern.SOLID_PATTERN 
  30. pattern.pattern_fore_colour = 5  # May be: 8 through 63. 0 = Black, 1 = White, 2 = Red, 3 = Green, 4 = Blue, 5 = Yellow, 6 = Magenta, 7 = Cyan, 16 = Maroon, 17 = Dark Green, 18 = Dark Blue, 19 = Dark Yellow , almost brown), 20 = Dark Magenta, 21 = Teal, 22 = Light Gray, 23 = Dark Gray, the list goes on... 
  31. style = xlwt.XFStyle()  # Create the Pattern 
  32. style.pattern = pattern  # Add Pattern to Style 
  33. worksheet.write(0, 1, '颜色', style) 
  34.  
  35. # 写入日期 
  36. style = xlwt.XFStyle() 
  37. # Other options: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0 
  38. style.num_format_str = 'M/D/YY' 
  39. worksheet.write(0, 2, datetime.datetime.now(), style) 
  40.  
  41. # 写入公式 
  42. worksheet.write(0, 3, 5)  # Outputs 5 
  43. worksheet.write(0, 4, 2)  # Outputs 2 
  44. # Should output "10" (A1[5] * A2[2]) 
  45. worksheet.write(1, 3, xlwt.Formula('D1*E1')) 
  46. # Should output "7" (A1[5] + A2[2]) 
  47. worksheet.write(1, 4, xlwt.Formula('SUM(D1,E1)')) 
  48.  
  49. # 写入超链接 
  50. worksheet.write(1, 0, xlwt.Formula('HYPERLINK("http://www.baidu.com";"百度一下")')) 
  51. # 保存 
  52. workbook.save('Excel_test.xls'

 需要注意的是最好在当前路径下通过命令行执行,否则无法生成文件。

万字长文记录Python读写EXCEL文件常用方法大全
万字长文记录Python读写EXCEL文件常用方法大全

4|0openpyxl

openpyxl是一个Python库,用于读取/写入Excel 2010 xlsx/xlsm/xltx/xltm文件。

安装包

  1. pip install openpyx 

安装完成可以开始进行读取数据

  1. import openpyxl 
  2. import os 
  3. file_path = os.path.dirname(os.path.abspath(__file__)) 
  4. base_path = os.path.join(file_path, 'data.xlsx'
  5. workbook = openpyxl.load_workbook(base_path) 
  6. worksheet = workbook.get_sheet_by_name('Sheet1'
  7. row3=[item.value for item in list(worksheet.rows)[2]] 
  8. print('第3行值',row3) 
  9. col3=[item.value for item in list(worksheet.columns)[2]] 
  10. print('第3行值',col3) 
  11. cell_2_3=worksheet.cell(row=2,column=3).value 
  12. print('第2行第3列值',cell_2_3) 
  13. max_row=worksheet.max_row 
  14. print('最大行',max_row) 

  万字长文记录Python读写EXCEL文件常用方法大全

现在我们来开始写入数据

  1. import zipfile   
  2. # 创建文件句柄   
  3. file = zipfile.ZipFile("测试.zip"'r')   
  4. # 提取压缩文件中的内容,注意密码必须是bytes格式,path表示提取到哪   
  5. file.extractall(path='.', pwd='123'.encode('utf-8'))  

  万字长文记录Python读写EXCEL文件常用方法大全

万字长文记录Python读写EXCEL文件常用方法大全

5|0pandas

pandas支持xls, xlsx, xlsm, xlsb, odf, ods和odt文件扩展名从本地文件系统或URL读取。支持读取单个工作表或工作表列表的选项。

首先依然是安装包

  1. pip install pandas 

语法:

  1. pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, **kwds) 
  • io,Excel的存储路径
  • sheet_name,要读取的工作表名称
  • header, 用哪一行作列名
  • names, 自定义最终的列名
  • index_col, 用作索引的列
  • usecols,需要读取哪些列
  • squeeze,当数据仅包含一列
  • converters ,强制规定列数据类型
  • skiprows,跳过特定行
  • nrows ,需要读取的行数
  • skipfooter , 跳过末尾n行
  1. import pandas as pd  
  2. import os 
  3.  
  4. file_path = os.path.dirname(os.path.abspath(__file__)) 
  5. base_path = os.path.join(file_path, 'data.xlsx'
  6. df = pd.read_excel(base_path) 
  7. print(df) 

  万字长文记录Python读写EXCEL文件常用方法大全

写入数据

语法:

  1. DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=Trueindex=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None) 

参数说明:

  • excel_writer:文件路径或现有的ExcelWriter
  • sheet_name:将包含数据文件的工作表的名称
  • na_rep:缺失的数据表示
  • float_format:格式化浮点数的字符串。例如float_format = " %。2f"格式为0.1234到0.12。
  • columns:列
  • header:写出列名。如果给定一个字符串列表,则假定它是列名的别名。
  • index:写入行名称(索引)
  • index_label:如果需要,索引列的列标签。如果未指定,并且标头和索引为真,则使用索引名。如果DataFrame使用多索引,应该给出一个序列。
  • startrow:左上角的单元格行转储数据帧。
  • startcol:左上角单元格列转储数据帧。
  • engine:编写要使用的引擎“ openpyxl”或“ xlsxwriter”。 您还可以通过选项io.excel.xlsx.writer,io.excel.xls.writer和io.excel.xlsm.writer进行设置。
  • merge_cells:将多索引和层次结构行写入合并单元格。
  • encoding:对生成的excel文件进行编码。仅对xlwt有必要,其他编写器本身支持unicode。
  • inf_rep:表示无穷大。
  • verbose:在错误日志中显示更多信息。
  • freeze_panes:指定要冻结的最底部的行和最右边的列
  1. from pandas import DataFrame 
  2.  
  3. data = {'name': ['张三''李四''王五'],'age': [11, 12, 13],'sex': ['男''女''男']} 
  4.  
  5. df = DataFrame(data) 
  6.  
  7. df.to_excel('file.xlsx'

 万字长文记录Python读写EXCEL文件常用方法大全

万字长文记录Python读写EXCEL文件常用方法大全

 

责任编辑:姜华 来源: 今日头条
相关推荐

2021-10-18 11:58:56

负载均衡虚拟机

2022-09-06 08:02:40

死锁顺序锁轮询锁

2021-01-19 05:49:44

DNS协议

2022-09-14 09:01:55

shell可视化

2020-07-15 08:57:40

HTTPSTCP协议

2020-11-16 10:47:14

FreeRTOS应用嵌入式

2020-07-09 07:54:35

ThreadPoolE线程池

2022-10-10 08:35:17

kafka工作机制消息发送

2024-03-07 18:11:39

Golang采集链接

2022-07-19 16:03:14

KubernetesLinux

2023-06-12 08:49:12

RocketMQ消费逻辑

2024-05-10 12:59:58

PyTorch人工智能

2021-08-26 05:02:50

分布式设计

2022-09-08 10:14:29

人脸识别算法

2024-01-11 09:53:31

面试C++

2022-07-15 16:31:49

Postman测试

2024-01-05 08:30:26

自动驾驶算法

2022-03-28 10:56:11

Python字符串格式化

2021-06-04 07:27:24

sourcemap前端技术

2022-04-25 10:56:33

前端优化性能
点赞
收藏

51CTO技术栈公众号