Python增强办公效率的 11 个实用代码段

开发
本文将介绍一些实用的 Python 脚本,用于批量创建文件夹、重命名文件、处理 Excel 数据、合并 PDF 文件等。这些工具能显著减少重复性工作,提升工作效率。

在日常工作中,许多任务可以通过编程自动化来提高效率。本文将介绍一些实用的 Python 脚本,用于批量创建文件夹、重命名文件、处理 Excel 数据、合并 PDF 文件等。这些工具能显著减少重复性工作,提升工作效率。

1. 快速生成批量文件夹

工作中经常需要创建多个文件夹来分类存储不同类型的文件。手动创建不仅耗时还容易出错。利用 Python 可以快速生成批量文件夹。

import os

def create_folders(base_path, folder_names):
    """
    在指定路径下创建多个文件夹。
    
    :param base_path: 文件夹创建的基础路径
    :param folder_names: 要创建的文件夹名称列表
    """
    for name in folder_names:
        path = os.path.join(base_path, name)
        if not os.path.exists(path):
            os.makedirs(path)
            print(f"创建文件夹 {path}")

# 示例使用
folder_names = ['2023年报表', '2023年会议记录', '2023年项目文档']
create_folders('C:\\Users\\YourName\\Documents', folder_names)

输出结果:

创建文件夹 C:\Users\YourName\Documents\2023年报表
创建文件夹 C:\Users\YourName\Documents\2023年会议记录
创建文件夹 C:\Users\YourName\Documents\2023年项目文档

2. 批量重命名文件

当有大量文件需要重命名时,手动操作显然不现实。Python 的 os 模块可以轻松完成这一任务。

import os

def rename_files(directory, prefix):
    """
    批量重命名目录下的所有文件,添加前缀。
    
    :param directory: 需要重命名文件所在的目录
    :param prefix: 添加到文件名前面的前缀
    """
    for filename in os.listdir(directory):
        old_name = os.path.join(directory, filename)
        new_name = os.path.join(directory, f"{prefix}_{filename}")
        os.rename(old_name, new_name)
        print(f"重命名 {old_name} 为 {new_name}")

# 示例使用
rename_files('C:\\Users\\YourName\\Documents\\2023年报表', '报表')

输出结果:

重命名 C:\Users\YourName\Documents\2023年报表\file1.xlsx 为 C:\Users\YourName\Documents\2023年报表\报表_file1.xlsx
重命名 C:\Users\YourName\Documents\2023年报表\file2.xlsx 为 C:\Users\YourName\Documents\2023年报表\报表_file2.xlsx

3. Excel 数据处理

日常工作中经常需要处理 Excel 表格数据。使用 pandas 库可以高效地读取、处理 Excel 文件。

import pandas as pd

def process_excel(file_path):
    """
    读取并处理 Excel 文件。
    
    :param file_path: Excel 文件路径
    """
    # 读取 Excel 文件
    df = pd.read_excel(file_path)
    
    # 处理数据
    df['Total'] = df['Quantity'] * df['Price']
    df.dropna(inplace=True)  # 删除缺失值
    
    # 保存处理后的数据
    df.to_excel('processed_data.xlsx', index=False)

# 示例使用
process_excel('C:\\Users\\YourName\\Documents\\sales_data.xlsx')

输出结果:

  • 原始 Excel 文件中的数据被读入 DataFrame。
  • 新增一列 Total 计算销售额。
  • 删除包含 NaN 的行。
  • 将处理后的数据保存到新文件 processed_data.xlsx 中。

4. PDF 文档合并

经常需要将多个 PDF 文件合并成一个文档。借助于 PyPDF2 库可以轻松实现该功能。

from PyPDF2 import PdfFileMerger

def merge_pdfs(paths, output):
    """
    合并多个 PDF 文件。
    
    :param paths: PDF 文件路径列表
    :param output: 输出文件路径
    """
    merger = PdfFileMerger()
    
    for pdf in paths:
        merger.append(pdf)
    
    merger.write(output)
    merger.close()

# 示例使用
pdf_paths = ['report_part1.pdf', 'report_part2.pdf', 'report_part3.pdf']
merge_pdfs(pdf_paths, 'complete_report.pdf')

输出结果:

  • complete_report.pdf 文件中包含了三个部分的内容。

5. 文本内容替换

在处理大量文本文件时,经常需要批量替换某些内容。Python 的 re 模块提供了强大的正则表达式支持,可以轻松完成这一任务。

import re
import os

def replace_text_in_files(directory, pattern, replacement):
    """
    在指定目录下的所有文本文件中替换特定内容。
    
    :param directory: 目录路径
    :param pattern: 要替换的模式(正则表达式)
    :param replacement: 替换的内容
    """
    for filename in os.listdir(directory):
        if filename.endswith('.txt'):
            filepath = os.path.join(directory, filename)
            with open(filepath, 'r') as file:
                content = file.read()
            
            updated_content = re.sub(pattern, replacement, content)
            
            with open(filepath, 'w') as file:
                file.write(updated_content)
                print(f"更新文件 {filepath}")

# 示例使用
directory = 'C:\\Users\\YourName\\Documents\\text_files'
pattern = r'old_text'
replacement = 'new_text'
replace_text_in_files(directory, pattern, replacement)

输出结果:

更新文件 C:\Users\YourName\Documents\text_files\file1.txt
更新文件 C:\Users\YourName\Documents\text_files\file2.txt

6. 发送邮件自动化

发送邮件是日常工作的一部分。使用 smtplib 和 email 库可以自动发送邮件,节省时间和精力。

import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart

def send_email(subject, body, to_emails):
    """
    发送邮件。
    
    :param subject: 邮件主题
    :param body: 邮件正文
    :param to_emails: 收件人邮箱列表
    """
    sender_email = 'your_email@example.com'
    sender_password = 'your_password'

    message = MIMEMultipart()
    message['From'] = sender_email
    message['To'] = ', '.join(to_emails)
    message['Subject'] = subject

    message.attach(MIMEText(body, 'plain'))

    try:
        server = smtplib.SMTP('smtp.example.com', 587)
        server.starttls()
        server.login(sender_email, sender_password)
        text = message.as_string()
        server.sendmail(sender_email, to_emails, text)
        server.quit()
        print("邮件发送成功")
    except Exception as e:
        print(f"邮件发送失败:{e}")

# 示例使用
subject = "本周工作报告"
body = "这是本周的工作报告,请查收。"
to_emails = ['alice@example.com', 'bob@example.com']
send_email(subject, body, to_emails)

输出结果:

邮件发送成功

7. 数据可视化

数据分析过程中,图表能够帮助更好地理解数据。使用 matplotlib 库可以轻松绘制各种图表。

import matplotlib.pyplot as plt
import pandas as pd

def plot_data(data, title, x_label, y_label):
    """
    绘制数据图表。
    
    :param data: 数据 DataFrame
    :param title: 图表标题
    :param x_label: X 轴标签
    :param y_label: Y 轴标签
    """
    plt.figure(figsize=(10, 6))
    plt.plot(data[x_label], data[y_label])
    plt.title(title)
    plt.xlabel(x_label)
    plt.ylabel(y_label)
    plt.grid(True)
    plt.show()

# 示例使用
data = pd.DataFrame({
    'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun'],
    'Sales': [200, 250, 300, 350, 400, 450]
})
plot_data(data, 'Monthly Sales', 'Month', 'Sales')

输出结果:

  • 绘制了一个简单的折线图,显示每月的销售数据。

8. Excel 数据批量处理

当需要对多个 Excel 文件进行相同的操作时,可以编写一个脚本来批量处理。

import pandas as pd
import os

def process_excel_files(directory):
    """
    批量处理目录下的所有 Excel 文件。
    
    :param directory: 目录路径
    """
    for filename in os.listdir(directory):
        if filename.endswith('.xlsx'):
            filepath = os.path.join(directory, filename)
            df = pd.read_excel(filepath)
            
            # 数据处理
            df['Total'] = df['Quantity'] * df['Price']
            df.dropna(inplace=True)
            
            # 保存处理后的数据
            output_path = os.path.join(directory, f"processed_{filename}")
            df.to_excel(output_path, index=False)
            print(f"处理并保存文件 {output_path}")

# 示例使用
directory = 'C:\\Users\\YourName\\Documents\\sales_data'
process_excel_files(directory)

输出结果:

处理并保存文件 C:\Users\YourName\Documents\sales_data\processed_sales1.xlsx
处理并保存文件 C:\Users\YourName\Documents\sales_data\processed_sales2.xlsx

9. 自动化生成报告

在定期汇报工作中,自动生成报告可以节省大量时间。使用 pandas 和 openpyxl 库可以实现这一目标。

import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

def generate_report(data, output_path):
    """
    生成 Excel 报告。
    
    :param data: 数据 DataFrame
    :param output_path: 输出文件路径
    """
    wb = Workbook()
    ws = wb.active
    ws.title = 'Report'

    for r in dataframe_to_rows(data, index=False, header=True):
        ws.append(r)

    wb.save(output_path)
    print(f"报告已生成:{output_path}")

# 示例使用
data = pd.DataFrame({
    'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun'],
    'Sales': [200, 250, 300, 350, 400, 450]
})
generate_report(data, 'monthly_report.xlsx')

输出结果:

报告已生成:monthly_report.xlsx

10. 文件压缩与解压

处理大量文件时,压缩与解压文件可以节省存储空间。使用 zipfile 模块可以轻松实现。

import zipfile
import os

def compress_files(directory, output_path):
    """
    压缩指定目录下的所有文件。
    
    :param directory: 目录路径
    :param output_path: 输出文件路径
    """
    with zipfile.ZipFile(output_path, 'w', zipfile.ZIP_DEFLATED) as zipf:
        for root, dirs, files in os.walk(directory):
            for file in files:
                file_path = os.path.join(root, file)
                zipf.write(file_path, os.path.relpath(file_path, directory))
                print(f"压缩文件 {file_path}")

# 示例使用
directory = 'C:\\Users\\YourName\\Documents\\project_files'
output_path = 'project_files.zip'
compress_files(directory, output_path)

输出结果:

压缩文件 C:\Users\YourName\Documents\project_files\file1.txt
压缩文件 C:\Users\YourName\Documents\project_files\file2.txt

11. 实战案例:自动化数据处理与报告生成

假设你是一名财务分析师,每天需要处理大量的销售数据,并生成一份报告。以下是一个完整的自动化脚本示例:

import pandas as pd
import matplotlib.pyplot as plt
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
import zipfile
import os
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart

def process_data(input_directory, output_directory):
    """
    处理数据并生成报告。
    
    :param input_directory: 输入数据目录
    :param output_directory: 输出数据目录
    """
    # 读取数据
    data = pd.DataFrame()
    for filename in os.listdir(input_directory):
        if filename.endswith('.xlsx'):
            filepath = os.path.join(input_directory, filename)
            df = pd.read_excel(filepath)
            data = pd.concat([data, df])

    # 数据处理
    data['Total'] = data['Quantity'] * data['Price']
    data.dropna(inplace=True)

    # 保存处理后的数据
    output_path = os.path.join(output_directory, 'processed_data.xlsx')
    data.to_excel(output_path, index=False)
    print(f"处理并保存数据:{output_path}")

    # 生成图表
    plt.figure(figsize=(10, 6))
    plt.plot(data['Date'], data['Total'])
    plt.title('Monthly Sales')
    plt.xlabel('Date')
    plt.ylabel('Total Sales')
    plt.grid(True)
    plt.savefig(os.path.join(output_directory, 'sales_chart.png'))
    print("图表已生成")

    # 生成报告
    wb = Workbook()
    ws = wb.active
    ws.title = 'Report'

    for r in dataframe_to_rows(data, index=False, header=True):
        ws.append(r)

    wb.save(os.path.join(output_directory, 'monthly_report.xlsx'))
    print("报告已生成")

    # 压缩文件
    with zipfile.ZipFile(os.path.join(output_directory, 'monthly_data.zip'), 'w', zipfile.ZIP_DEFLATED) as zipf:
        for root, dirs, files in os.walk(output_directory):
            for file in files:
                file_path = os.path.join(root, file)
                zipf.write(file_path, os.path.relpath(file_path, output_directory))
                print(f"压缩文件 {file_path}")

    # 发送邮件
    sender_email = 'your_email@example.com'
    sender_password = 'your_password'
    to_emails = ['alice@example.com', 'bob@example.com']

    message = MIMEMultipart()
    message['From'] = sender_email
    message['To'] = ', '.join(to_emails)
    message['Subject'] = 'Monthly Report'

    with open(os.path.join(output_directory, 'monthly_report.xlsx'), 'rb') as file:
        attachment = file.read()
        part = MIMEBase('application', 'octet-stream')
        part.set_payload(attachment)
        encoders.encode_base64(part)
        part.add_header('Content-Disposition', f'attachment; filename=monthly_report.xlsx')
        message.attach(part)

    with open(os.path.join(output_directory, 'sales_chart.png'), 'rb') as file:
        attachment = file.read()
        part = MIMEBase('application', 'octet-stream')
        part.set_payload(attachment)
        encoders.encode_base64(part)
        part.add_header('Content-Disposition', f'attachment; filename=sales_chart.png')
        message.attach(part)

    try:
        server = smtplib.SMTP('smtp.example.com', 587)
        server.starttls()
        server.login(sender_email, sender_password)
        text = message.as_string()
        server.sendmail(sender_email, to_emails, text)
        server.quit()
        print("邮件发送成功")
    except Exception as e:
        print(f"邮件发送失败:{e}")

# 示例使用
input_directory = 'C:\\Users\\YourName\\Documents\\sales_data'
output_directory = 'C:\\Users\\YourName\\Documents\\reports'
process_data(input_directory, output_directory)

输出结果:

处理并保存数据:C:\Users\YourName\Documents\reports\processed_data.xlsx
图表已生成
报告已生成
压缩文件 monthly_report.xlsx
压缩文件 sales_chart.png
压缩文件 processed_data.xlsx
邮件发送成功

总结

本文介绍了多种 Python 脚本,用于提高日常工作的效率。通过自动化批量创建文件夹、重命名文件、处理 Excel 数据、合并 PDF 文件、批量替换文本内容、发送邮件、数据可视化、批量处理 Excel 文件、生成报告、压缩文件等功能,可以显著减少重复性工作。希望这些工具能帮助你更高效地完成工作任务。

责任编辑:赵宁宁 来源: 手把手PythonAI编程
相关推荐

2016-02-15 09:25:00

R语言运算效率大数据

2011-08-15 13:29:50

jQuery

2019-07-02 10:36:30

JavaScript硬件开发

2021-04-25 07:47:36

电脑软件EverythingIDM

2020-01-03 10:24:06

Python 开发编程语言

2022-09-21 12:46:39

开发JavaScrip代码

2024-09-26 06:21:59

Python代码

2022-02-18 11:51:36

Python代码编程语言

2022-03-18 21:27:36

Python无代码

2024-10-28 19:36:05

2022-09-23 09:14:28

JavaScriptES6代码

2022-06-23 09:04:14

ReactHooks项目

2024-01-07 20:14:18

CSS开发工具

2023-11-22 13:33:22

VS Code人工智能插件

2022-01-16 08:00:28

PythonFor循环

2023-11-28 12:07:06

Python代码

2024-03-27 14:06:58

Python代码开发

2024-01-16 15:19:29

Python内存

2022-06-01 10:45:52

C语言代码优化

2021-01-26 12:16:00

Python开发工具
点赞
收藏

51CTO技术栈公众号