惊呆同事的自动化小工具来了!一键实现批量将 PDF 文档转 Word

开发 开发工具
今天小编就给大家制作了一款批量将PDF文件转换为Word的神器,使用起来也是相当的方便。

无论是在工作还是学习当中,大家都会遇到这样一个问题,将“PDF当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成可编辑的格式。网上绝大多数的工具也都是收费的,今天小编就给大家制作了一款批量将PDF​文件转换为Word的神器,使用起来也是相当的方便。

实现效果​

我们首先来看一下出来的效果,如下图所示:

图片

图片图片图片图片图片

环境准备​

用到的模块叫做pdf2docx​,我们通过pip命令进行下载,如下:

pip install pdf2docx

后续我们还可以为py​文件打包,用到的库是pyinstaller:

pip install pyinstaller

代码实现​

我们先简单地实现将单个PDF​文档转换成Word文档,代码如下:

from pdf2docx import Converter
cv = Converter(r"pdf文件的路径")
cv.convert("test.docx", start=0,end=None)
cv.close()

那么上面的是单个PDF​文件,要是涉及到是多个PDF​文件,则需要用到遍历上传过来的每一个文件,用到for循环遍历:

def startAction(self):
output_path_1 = Path.joinpath(Path.home(), "Desktop")
output_path_2 = str(output_path_1) + "\\output"
if not os.path.exists(output_path_2):
os.mkdir(output_path_2)

for path_list in pdfPath_list:
print("路径: ", path_list)
name = path_list.split("/")[-1].split(".")[0]
cv = Converter(path_list)
cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None)
cv.close()

msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
msg_box.exec_()

上述的代码,我们首先将指定好输出的Word​文档的位置,这里小编设置的是在桌面,然后通过for循环去遍历处理每一个PDF文档,当所有的步骤都完成的时候,提示我们已经完成了。当然整个可视化界面当中还有一个上传文件的功能,代码如下:

# 选择本地文件上传
def uploadFiles(self):
global pdfPath_list # 这里为了方便别的地方引用文件路径,将其设置为全局变量
pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上传文件", r"路径", "*.pdf;;All Files(*)")
# 显示所选文件的路径
self.ui.lineEdit.setText(",".join(pdfPath_list))

整体的代码如下所示:

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os

class OCRQt:
def __init__(self):
self.ui = QUiLoader().load('pdf2word.ui')
self.ui.pushButton.clicked.connect(self.uploadFiles)
self.ui.pushButton_2.clicked.connect(self.startAction)

def uploadFiles(self):
........
........

def startAction(self):
.......
.......

if __name__ == '__main__':
app = QApplication([])
# 显示创建的界面
MainWindow = OCRQt() # 创建窗体对象
MainWindow.ui.show() # 显示窗体
app.exit(app.exec_()) # 程序关闭时退出进程
责任编辑:赵宁宁 来源: Python爱好者集中营
相关推荐

2024-04-03 15:27:31

Python接口自动化开发

2012-03-15 10:32:05

Windows系统网络故障

2020-08-25 20:10:53

GitHub代码开发者

2020-11-03 10:23:46

Python 开发编程语言

2021-02-01 12:24:40

Python日志Expect

2024-03-15 14:34:12

Oracle数据库一键巡检

2020-02-14 11:00:59

开发者技能工具

2024-08-07 08:08:42

2015-03-09 11:10:14

运维

2021-02-06 11:16:28

Python开发工具

2009-11-19 08:48:10

Windows 7桌面工具

2021-11-05 06:57:50

架构工具代码

2021-02-25 17:21:57

微软Word 文档PowerPoint

2009-09-04 13:55:04

C#文档自动化

2023-12-07 14:15:13

2022-12-28 12:29:45

duf命令

2017-07-25 14:20:13

戴尔配置功耗

2010-07-01 10:24:30

UML小工具

2009-12-08 14:02:25

Windows 7小工

2024-04-30 08:00:00

人工智能自动化文件处理
点赞
收藏

51CTO技术栈公众号