再见Excel,你好Pandas!

大数据
写⼊数据时,要注意不同的⽂件格式选⽤不同的⽅法,如写⼊csv⽂件使⽤to_csv,写⼊ excel时使⽤to_excel,并且要注意添加编码⽅式。

再⻅Excel,你好Pandas!

数据的写⼊:

写⼊数据时,要注意不同的⽂件格式选⽤不同的⽅法,如写⼊csv⽂件使⽤to_csv,写⼊ excel时使⽤to_excel,并且要注意添加编码⽅式,下面创建⼀个表: 

  1. from pandas import Series,DataFrame   
  2. # 使用字典创建 
  3.  
  4. index_list['001','002','003','004','005','006','007','008','009','010' 
  5. name_list = ['李白','王昭君','诸葛亮','狄仁杰','孙尚香','妲己','周瑜','张飞','王昭君','大  
  6. 乔'] 
  7.  
  8. age_list=[25,28,27,25,30,29,25,32,28,26]  
  9. salary_list=['10k','12.5k','20k','14k','12k','17k','18k','21k','22k','21.5k' 
  10. marital_list = ['NO','NO','YES','YES','NO','NO','NO','YES','NO','YES' 
  11. dic={ 
  12.  
  13. '姓名': Series(data=name_list,index=index_list),  
  14. '年龄': Series(data=age_list,index=index_list), 
  15.  '薪资': Series(data=salary_list,index=index_list),  
  16. '婚姻状况': Series(data=marital_list,index=index_list)  
  17.  
  18. df=DataFrame(dic)  
  19. # 写入csv,path_or_buf为写入文本文件  
  20. df.to_csv(path_or_buf='./People_Information.csv' 
  21. encoding='utf_8_sig',index=False 
  22. print('end'

这⾥调⽤to_csv⽅法 写⼊数据,可以指定路径,参数encoding是指定编码⽅式,这样遇到中⽂不易出现乱码,参数index=False是为了去除掉⾏索引,不然⾏索引1,2,3,4等也会放到表⾥。

数据的读取:

读取数据时,不同的⽂件格式使⽤的⽅法也不⼀样, 读取csv使⽤read_csv,excel使⽤ read_excel,并且可以指定⽂件进⾏读,另外⼀个Excel⽂件可以创建多个表,然后在不同的表中存储不同数据,这种形式的⽂件很常⻅。但是要注意csv⽂件不存在多个sheet的问题。 

  1. 如: import pandas as pd  
  2. #sheet_name指定读取⼯作铺中的那个sheet(sheet名称)  
  3. sheet1 = pd.read_excel('./data/sheet.xlsx',sheet_name='sheet1' 
  4. print(sheet1.head())  
  5. sheet2 = pd.read_excel('./data/sheet.xlsx',sheet_name='sheet2' 
  6. print(sheet2.head())  
  7. 当csv或者excel中数据的第⼀⾏是⼀条脏数据,可以利⽤read_excel()中的header参数进  
  8. ⾏选择哪⼀⾏作为我们的列索引。如:  
  9. import pandas as pd  
  10. #这里将header设置为1(第一行是0),代表数据将从第2行开始读取,第一行的数据会被  
  11. 忽略  
  12. people = pd.read_csv('./data/People1.csv',header = 1)  
  13. print(people.head())  

如果都不满⾜的你的要求,可以将header设置为None,列索引值会使⽤默认的1、2、 3、4,之后在⾃⾏设置。

当指定了header的值,读出来的数据就是从该⾏开始向下切⽚,该⾏以上的数据会被忽略。

 

责任编辑:未丽燕 来源: 今日头条
相关推荐

2020-09-27 11:15:37

可视化PandasPython

2012-08-01 09:50:09

HotmailOutlook微软

2015-03-16 11:09:28

MongoDBPostgreSQL数据迁移

2021-04-23 09:09:19

GraphQLREST查询

2021-07-27 05:56:53

CrocFTPSFTP

2019-02-01 10:35:33

PythonGo语言编程语言

2009-03-30 08:44:22

微软Windows 7操作系统

2018-01-02 08:40:19

云安全云迁移数据泄露

2023-11-28 17:24:45

2011-01-07 18:05:37

QQ腾讯移动互联网

2021-06-02 22:25:26

2G5G运营商

2014-11-27 14:26:46

苹果iPhone停产

2022-08-24 13:39:46

PandasGUIExcel

2021-02-17 13:20:51

forpandas语言

2011-09-23 14:24:58

惠普云计算李艾科

2023-01-05 11:34:46

PandasMerge方法

2021-04-15 22:17:16

PythonExcel代码

2020-10-29 10:44:59

斗鱼腾讯虎牙

2021-01-21 07:16:03

RocketMQKafka中间件

2022-09-26 00:00:02

PandasExcel文件
点赞
收藏

51CTO技术栈公众号