鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

账号设置退出

Python循环12种超强写法，又快又省内存

作者：zglg 2019-11-11 13:40:45

我不打算笼统的介绍它们所能实现的功能，而是想分析这些功能背后的实现代码，它们如何做到高效节省内存的，Python内核的贡献者们又是如何写出一手漂亮的代码的，这很有趣，不是吗？

0 前言

说到处理循环，我们习惯使用for, while等，比如依次打印每个列表中的字符：

Python循环12种超强写法，又快又省内存

在打印内容字节数较小时，全部载入内存后，再打印，没有问题。可是，如果现在有成千上百万条车辆行驶轨迹，叫你分析出其中每个客户的出行规律，堵车情况等，假如是在单机上处理这件事。

你可能首先要面临，也可能被你忽视，最后代码都写好后，才可能暴露出的一个问题:outofmemory, 这在实际项目中经常遇到。

这个问题提醒我们，处理数据时，如何写出高效利用内存的程序，就显得很重要。今天，我们就来探讨如何高效利用内存，节省内存同时还能把事情办好。

其实，Python已经准备好一个模块专门用来处理这件事，它就是itertools 模块，这里面几个函数的功能其实很好理解。

我不打算笼统的介绍它们所能实现的功能，而是想分析这些功能背后的实现代码，它们如何做到高效节省内存的，Python内核的贡献者们又是如何写出一手漂亮的代码的，这很有趣，不是吗？

OK，let's go. Hope you enjoy the journey!

1 拼接元素

itertools 中的chain 函数实现元素拼接，原型如下，参数*表示个数可变的参数

chain(iterables)

应用如下：

Python循环12种超强写法，又快又省内存

哇，不能再好用了，它有点join的味道，但是比join强，它的重点在于参数都是可迭代的实例。

那么，chain如何实现高效节省内存的呢？chain大概的实现代码如下：

Python循环12种超强写法，又快又省内存

以上代码不难理解，chain本质返回一个生成器，所以它实际上是一次读入一个元素到内存，所以做到最高效地节省内存。

2 逐个累积

返回列表的累积汇总值，原型：

accumulate(iterable[, func, *, initial=None])

应用如下：

Python循环12种超强写法，又快又省内存

accumulate大概的实现代码如下：

Python循环12种超强写法，又快又省内存

以上代码，你还好吗？与chain简单的yield不同，此处稍微复杂一点，yield有点像return，所以 yield total那行直接就返回一个元素，也就是iterable的第一个元素，因为任何时候这个函数返回的第一个元素就是它的第一个。又因为yield返回的是一个generator对象，比如名字gen，所以next(gen)时，代码将会执行到 for element in it:这行，而此时的迭代器it 已经指到iterable的第二个元素，OK，相信你懂了！

3 漏斗筛选

它是compress 函数，功能类似于漏斗功能，所以我称它为漏斗筛选，原型：

compress(data, selectors)

Python循环12种超强写法，又快又省内存

容易看出，compress返回的元素个数等于两个参数中较短的列表长度。

它的大概实现代码：

Python循环12种超强写法，又快又省内存

这个函数非常好用

4 段位筛选

扫描列表，不满足条件处开始往后保留，原型如下：

dropwhile(predicate, iterable)

应用例子：

Python循环12种超强写法，又快又省内存

实现它的大概代码如下：

Python循环12种超强写法，又快又省内存

5 段位筛选2

扫描列表，只要满足条件就从可迭代对象中返回元素，直到不满足条件为止，原型如下：

takewhile(predicate, iterable)

应用例子：

Python循环12种超强写法，又快又省内存

实现它的大概代码如下：

6 次品筛选

扫描列表，只要不满足条件都保留，原型如下：

dropwhile(predicate, iterable)

应用例子：

Python循环12种超强写法，又快又省内存

实现它的大概代码如下：

Python循环12种超强写法，又快又省内存

7 切片筛选

Python中的普通切片操作，比如：

Python循环12种超强写法，又快又省内存

它们的缺陷还是lis 必须全部载入内存，所以更节省内存的操作islice，原型如下：

islice(iterable, start, stop[, step])

应用例子：

Python循环12种超强写法，又快又省内存

实现它的大概代码如下：

Python循环12种超强写法，又快又省内存

巧妙利用生成器迭代结束时会抛出异常StopIteration，做一些边界处理的事情。

8 细胞分裂

tee函数类似于我们熟知的细胞分裂，它能复制原迭代器n个，原型如下：

tee(iterable, n=2)

应用如下，可以看出复制出的两个迭代器是独立的

Python循环12种超强写法，又快又省内存

实现它的代码大概如下：

Python循环12种超强写法，又快又省内存

tee 实现内部使用一个队列类型deques，起初生成空队列，向复制出来的每个队列中添加元素newval, 同时yield 当前被调用的mydeque中的最左元素。

9 map变体

starmap可以看做是map的变体，它能更加节省内存，同时iterable的元素必须也为可迭代对象，原型如下：

starmap(function, iterable)

应用它：

Python循环12种超强写法，又快又省内存

starmap的实现细节如下：

Python循环12种超强写法，又快又省内存

10 复制元素

repeat实现复制元素n次，原型如下：

repeat(object[, times])

应用如下：

Python循环12种超强写法，又快又省内存

它的实现细节大概如下：

Python循环12种超强写法，又快又省内存

11 笛卡尔积

笛卡尔积实现的效果同下：

Python循环12种超强写法，又快又省内存

所以，笛卡尔积的实现效果如下：

Python循环12种超强写法，又快又省内存

它的实现细节：

Python循环12种超强写法，又快又省内存

12 加强版zip

组合值。若可迭代对象的长度未对齐，将根据 fillvalue 填充缺失值，注意：迭代持续到耗光最长的可迭代对象，效果如下：

Python循环12种超强写法，又快又省内存

它的实现细节：

Python循环12种超强写法，又快又省内存

它里面使用repeat，也就是在可迭代对象的长度未对齐时，根据 fillvalue 填充缺失值。理解上面代码的关键是迭代器对象(iter)，next方法的特殊性：

Python循环12种超强写法，又快又省内存

结合这个提示再理解上面代码，就不会吃力。

责任编辑：张燕妮来源： Python与算法社区

Python 开发编程语言

51CTO技术栈公众号

业务
速览

媒体

51CTO CIOAge HC3i

社区

51CTO博客鸿蒙开发者社区 AI.x社区

教育

51CTO学堂精培企业培训 CTO训练营