我用Python自动生成报表以邮件发送,减轻了我的工作压力

开发 后端
数据分析师肯定每天都被各种各样的数据数据报表搞得焦头烂额,老板的,运营的、产品的等等。而且大部分报表都是重复性的工作,这篇文章就是帮助大家如何用Python来实现报表的自动发送,解放你的劳动力,可以让你有时间去做更有意思的事情。

数据分析师肯定每天都被各种各样的数据数据报表搞得焦头烂额,老板的,运营的、产品的等等。而且大部分报表都是重复性的工作,这篇文章就是帮助大家如何用Python来实现报表的自动发送,解放你的劳动力,可以让你有时间去做更有意思的事情。

首先来介绍下实现自动报表要使用到的Python库:

  • pymysql 一个可以连接MySQL实例并且实现增删改查功能的库
  • datetime Python标准库中自带的关于时间的库
  • openpyxl 一个可以读写07版以后的Excel文档(.xlsx格式也支持)的库
  • smtplib SMTP即简单邮件传输协议,Python简单封装成了一个库
  • email 一个用来处理邮件消息的库

为什么使用openpyxl库来处理Excel呢?因为它支持每个sheet的行数为100W+,也是支持xlsx格式的文件。如果你接受xls文件,并且每个sheet的行数小于6W,也是可以使用xlwt库,它对大文件的读取速度要大于openpyxl。

接下来我们就进入实战部分,来正式实现这个过程。我把整个实现过程分成几个函数的方式来实现,这样看着会比较有结构感。

一、首先导入所有要用到的库

  1. # encoding=utf-8 
  2. import pymysql as pms 
  3. import openpyxl 
  4. import datetime 
  5. from email.mime.text import MIMEText 
  6. from email.mime.multipart import MIMEMultipart 
  7. from email.header import Header 
  8. import smtplib 

二、 编写一个传入sql就返回数据的函数get_datas(sql)

  1. def get_datas(sql): 
  2.  # 一个传入sql导出数据的函数 
  3.  # 跟数据库建立连接 
  4.  conn = pms.connect(host='实例地址'user='用户'
  5.  passwd='密码'database='库名', port=3306, charset="utf8"
  6.  # 使用 cursor() 方法创建一个游标对象 cursor 
  7.  cur = conn.cursor() 
  8.  # 使用 execute() 方法执行 SQL 
  9.  cur.execute(sql) 
  10.  # 获取所需要的数据 
  11.  datas = cur.fetchall() 
  12.  #关闭连接 
  13.  cur.close() 
  14.  #返回所需的数据 
  15.  return datas 

三、 编写一个传入sql就返回数据的字段名称的函数get_datas(sql),因为一个函数只能返回一个值,这边就用2个函数来分别返回数据和字段名称(也就是excel里的表头)

  1. def get_fields(sql): 
  2.  # 一个传入sql导出字段的函数 
  3.  conn = pms.connect(host='rm-rj91p2yhl9dm2xmbixo.mysql.rds.aliyuncs.com'user='bi-analyzer'
  4.  passwd='pcNzcKPnn'database='kikuu', port=3306, charset="utf8"
  5.  cur = conn.cursor() 
  6.  cur.execute(sql) 
  7.  # 获取所需要的字段名称 
  8.  fields = cur.description 
  9.  cur.close() 
  10.  return fields 

四、 编写一个传入数据、字段名称、存储地址返回一个excel 的函数et_excel(data, field, file)

  1. def get_excel(data, field, file): 
  2.  # 将数据和字段名写入excel的函数 
  3.  #新建一个工作薄对象 
  4.  new = openpyxl.Workbook() 
  5.  #激活一个新的sheet 
  6.  sheet = new.active 
  7.  #给sheet命名 
  8.  sheet.title = '数据展示' 
  9.  #将字段名称循环写入excel***行,因为字段格式列表里包含列表,每个列表的***元素才是字段名称 
  10.  for col in range(len(field)): 
  11.  #row代表行数,column代表列数,value代表单元格输入的值,行数和列数都是从1开始,这点于python不同要注意 
  12.  _ = sheet.cell(row=1, column=col+1, value=u'%s' % field[col][0]) 
  13.  #将数据循环写入excel的每个单元格中  
  14.  for row in range(len(data)): 
  15.  for col in range(len(field)): 
  16.  #因为***行写了字段名称,所以要从第二行开始写入 
  17.  _ = sheet.cell(row=row+2, column=col + 1, value=u'%s' % data[row][col]) 
  18.  #将生成的excel保存,这步是必不可少的 
  19.  newworkbook = new.save(file) 
  20.  #返回生成的excel 
  21.  return newworkbook 

五、 编写一个自动获取昨天日期字符串格式的函数getYesterday()

  1. def getYesterday(): 
  2.  # 获取昨天日期的字符串格式的函数 
  3.  #获取今天的日期 
  4.  today = datetime.date.today() 
  5.  #获取一天的日期格式数据 
  6.  oneday = datetime.timedelta(days=1) 
  7.  #昨天等于今天减去一天 
  8.  yesterday = today - oneday 
  9.  #获取昨天日期的格式化字符串 
  10.  yesterdaystr = yesterday.strftime('%Y-%m-%d'
  11.  #返回昨天的字符串 
  12.  return yesterdaystr 

六、编写一个生成邮件的函数create_email(email_from, email_to, email_Subject, email_text, annex_path, annex_name)

  1. def create_email(email_from, email_to, email_Subject, email_text, annex_path, annex_name): 
  2.  # 输入发件人昵称、收件人昵称、主题,正文,附件地址,附件名称生成一封邮件 
  3.  #生成一个空的带附件的邮件实例 
  4.  message = MIMEMultipart() 
  5.  #将正文以text的形式插入邮件中 
  6.  message.attach(MIMEText(email_text, 'plain''utf-8')) 
  7.  #生成发件人名称(这个跟发送的邮件没有关系) 
  8.  message['From'] = Header(email_from, 'utf-8'
  9.  #生成收件人名称(这个跟接收的邮件也没有关系) 
  10.  message['To'] = Header(email_to, 'utf-8'
  11.  #生成邮件主题 
  12.  message['Subject'] = Header(email_Subject, 'utf-8'
  13.  #读取附件的内容 
  14.  att1 = MIMEText(open(annex_path, 'rb').read(), 'base64''utf-8'
  15.  att1["Content-Type"] = 'application/octet-stream' 
  16.  #生成附件的名称 
  17.  att1["Content-Disposition"] = 'attachment; filename=' + annex_name 
  18.  #将附件内容插入邮件中 
  19.  message.attach(att1) 
  20.  #返回邮件 
  21.  return message 

七、 生成一个发送邮件的函数send_email(sender, password, receiver, msg)

  1. def send_email(sender, password, receiver, msg): 
  2.  # 一个输入邮箱、密码、收件人、邮件内容发送邮件的函数 
  3.  try: 
  4.  #找到你的发送邮箱的服务器地址,已加密的形式发送 
  5.  server = smtplib.SMTP_SSL("smtp.mxhichina.com", 465) # 发件人邮箱中的SMTP服务器 
  6.  server.ehlo() 
  7.  #登录你的账号 
  8.  server.login(sender, password) # 括号中对应的是发件人邮箱账号、邮箱密码 
  9.  #发送邮件 
  10.  server.sendmail(sender, receiver, msg.as_string()) # 括号中对应的是发件人邮箱账号、收件人邮箱账号(是一个列表)、邮件内容 
  11.  print("邮件发送成功"
  12.  server.quit() # 关闭连接 
  13.  except Exception: 
  14.  print(traceback.print_exc()) 
  15.  print("邮件发送失败"

八、建立一个main函数,把所有的自定义内容输入进去,***执行main函数

  1. def main(): 
  2.  print(datetime.datetime.now()) 
  3.  my_sql = sql = "SELECT a.id '用户ID'
  4.  a.gmtCreate '用户注册时间'
  5.  af.lastLoginTime '***登录时间'
  6.  af.totalBuyCount '历史付款子单数'
  7.  af.paidmountUSD '历史付款金额'
  8.  af.lastPayTime '用户***支付时间' 
  9.  FROM table a 
  10.  LEFT JOIN tableb af ON a.id= af.accountId ;" 
  11.  # 生成数据 
  12.  my_data = get_datas(my_sql) 
  13.  # 生成字段名称 
  14.  my_field = get_fields(my_sql) 
  15.  # 得到昨天的日期 
  16.  yesterdaystr = getYesterday() 
  17.  # 文件名称 
  18.  my_file_name = 'user attribute' + yesterdaystr + '.xlsx' 
  19.  # 文件路径 
  20.  file_path = 'D:/work/report/' + my_file_name 
  21.  # 生成excel 
  22.  get_excel(my_data, my_field, file_path) 
  23.  my_email_from = 'BI部门自动报表机器人' 
  24.  my_email_to = '运营部' 
  25.  # 邮件标题 
  26.  my_email_Subject = 'user' + yesterdaystr 
  27.  # 邮件正文 
  28.  my_email_text = "Dear all
  29.     附件为每周数据,请查收! 
  30.  
  31. BI团队 " 
  32.  #附件地址 
  33.  my_annex_path = file_path 
  34.  #附件名称 
  35.  my_annex_name = my_file_name 
  36.  # 生成邮件 
  37.  my_msg = create_email(my_email_from, my_email_to, my_email_Subject, 
  38.  my_email_text, my_annex_path, my_annex_name) 
  39.  my_sender = '阿里云邮箱' 
  40.  my_password = '我的密码' 
  41.  my_receiver = [10001@qq.com']#接收人邮箱列表 
  42.  # 发送邮件 
  43.  send_email(my_sender, my_password, my_receiver, my_msg) 
  44.  print(datetime.datetime.now()) 
  45. if __name__ == "__main__"
  46.  main();  

 

责任编辑:庞桂玉 来源: 今日头条
相关推荐

2021-05-11 05:04:21

Python录取通知书

2010-06-01 10:57:47

职场人抑郁

2020-01-16 15:42:54

五福Python交互

2020-06-12 09:07:03

技术总监数据库

2023-12-06 11:10:08

2024-06-03 11:43:55

2021-12-02 06:34:34

GraylogELK日志

2021-12-03 10:46:49

ELKGraylog运维

2017-09-05 09:38:12

2022-06-10 13:40:44

CISO首席信息安全官

2017-03-23 10:42:05

Pythonjava开发

2017-06-05 08:55:27

Python起源应用

2019-11-19 11:29:50

Python数据标系

2022-08-17 11:20:23

Python微信

2009-10-13 14:49:00

工作求职之路

2019-04-28 11:48:54

Python面试工程师

2021-08-09 08:24:08

时间工作生活

2014-06-27 18:22:19

2020-02-06 11:30:08

代码JavaScript&&

2013-07-17 14:13:08

产品产品失败
点赞
收藏

51CTO技术栈公众号