一小段Python代码,破解加密zip文件的密码

开发 后端
今天的文章来自 盏茶作酒 同学。他在老电脑中发现了一个加密的 zip 文件,于是用 Python 破解了文件密码。在破解的过程中出现了内存爆炸的问题,通过阅读 Python 源代码找到了解决方案。

今天的文章来自 盏茶作酒 同学。他在老电脑中发现了一个加密的 zip 文件,于是用 Python 破解了文件密码。在破解的过程中出现了内存爆炸的问题,通过阅读 Python 源代码找到了解决方案。

下面就来给大家分享一下他的操作。

之前在家里的老电脑中,发现一个加密zip压缩包,由于时隔太久忘记密码了,依稀记得密码是6位字母加数字,网上下载了很多破解密码的软件都没有效果,于是想到自己用Python写一个暴力破解密码的脚本。

Python 有一个内置模块 zipfile 可以解压 zip 压缩包。先来测试一波:创建一个测试文件,压缩,设置解压密码为123。

 

  1. import zipfile  
  2. # 创建文件句柄  
  3. file = zipfile.ZipFile("测试.zip", 'r')  
  4. # 提取压缩文件中的内容,注意密码必须是bytes格式,path表示提取到哪  
  5. file.extractall(path='.'pwd='123'.encode('utf-8')) 

运行效果如下图所示,提取成功。

既然如此,那我不停尝试所有可能的密码组合去解压缩不就行了嘛~

[[404960]]

好了,开始破解老文件的密码。

为了提高速度,我还加了多线程的代码: 

  1. import zipfile  
  2. import itertools  
  3. from concurrent.futures import ThreadPoolExecutor  
  4. def extract(file, password):  
  5.     if not flag: return  
  6.     file.extractall(path='.'pwd=''.join(password).encode('utf-8'))  
  7. def result(f): 
  8.      exception = f.exception()  
  9.     if not exception:  
  10.         # 如果获取不到异常说明破解成功  
  11.         print('密码为:', f.pwd)  
  12.         global flag  
  13.         flag = False  
  14. if __name__ == '__main__':  
  15.     # 创建一个标志用于判断密码是否破解成功  
  16.     flag = True  
  17.     # 创建一个线程池 
  18.     pool = ThreadPoolExecutor(100)  
  19.     nums = [str(i) for i in range(10)]  
  20.     chrs = [chr(i) for i in range(65, 91)]  
  21.     # 生成数字+字母的6位数密码  
  22.     password_lst = itertools.permutations(nums + chrs, 6)  
  23.     # 创建文件句柄  
  24.     zfile = zipfile.ZipFile("加密文件.zip", 'r') 
  25.     for pwd in password_lst:  
  26.         if not flag: break  
  27.         f = pool.submit(extract, zfile, pwd)  
  28.         f.pwd = pwd  
  29.         f.pool = pool  
  30.         f.add_done_callback(result) 

然而,事情并没有那简单……

代码跑一会儿,内存爆了!

[[404961]]

于是,为了找寻问题所在,我就去查看了一下源码,发现ThreadPoolExecutor默认使用的是无界队列。而程序中尝试密码的速度跟不上生产密码的速度,就会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95:

找到病根儿,剩下的就是对症下药了。

继承并重写了ThreadPoolExecutor类中的_work_queue属性,将无界队列改成有界队列,这样就不会出现内存爆满的问题,看代码: 

  1. import queue  
  2. from concurrent.futures import ThreadPoolExecutor  
  3. class BoundedThreadPoolExecutor(ThreadPoolExecutor):  
  4.     def __init__(self, max_workers=Nonethread_name_prefix=''):  
  5.         super().__init__(max_workers, thread_name_prefix)  
  6.         self._work_queue = queue.Queue(self._max_workers * 2) # 设置队列大小 

用自定义的BoundedThreadPoolExecutor类替代前面代码中的ThreadPoolExecutor。

再次执行……

程序输入如下图内容:

Bingo!破解成功!(原来密码如此简单……图片)

话说回来,毕竟这个压缩包我是隐约知道它的位数和范围(字母和数字),所以破解出来需要的时间是可以忍受的。如果有天你在网上找了一个无人认领的加密压缩包,想要一窥究竟但又并不知道它有多少位密码,那我只能祝你好运啦~ 

 

责任编辑:庞桂玉 来源: Python编程
相关推荐

2020-12-21 16:00:07

Pythonzip文件密码

2020-12-13 17:57:16

加密密码Python

2018-04-09 08:31:02

Python代码

2021-12-20 10:15:16

zip密码命令网络安全

2013-06-04 13:43:53

2015-06-19 16:32:59

微软Office 365

2018-04-24 16:01:46

代码数据可视化Python

2010-11-17 11:26:49

2020-12-09 08:04:27

Centos8root密码

2010-07-06 10:35:59

2010-12-03 11:43:51

2009-12-09 13:54:42

PHP Zend加密文

2022-03-25 21:17:43

正则神经网络元字符

2024-10-28 15:22:13

2022-09-26 08:35:53

磁盘Java解密

2020-10-14 10:02:45

如何破解LUKS加密

2009-12-10 10:49:21

PHP eval加密

2018-02-24 10:56:29

PythonPygameJavaScript

2010-06-10 15:44:53

2011-12-09 10:17:07

点赞
收藏

51CTO技术栈公众号