前言
在Python编程中,循环处理是不可避免的,这涉及到两个重要的概念,即可迭代对象和迭代器(Iterable & Iterator)。这个关于迭代的主题,我将分为两到三篇内容来介绍,以帮助你在实际编程中理解和应用。本文为第一篇。
可迭代对象
可迭代对象(Iterable)是指能够一次返回一个成员的对象。可迭代对象的例子包括所有序列类型(如list, str和tuple)和一些非序列类型,如dict,文件对象,以及任何你所定义的类的对象,其实现了__iter__()方法或__getitem__()方法所规定的序列语义——及迭代协议(详见这里:)。
可迭代对象可以用于for循环和其他需要序列的地方(如zip(),map(),filter()…)。当可迭代对象作为参数传递给内置函数iter()时,它将返回该对象的迭代器(iterator)。这个迭代器只适合一组值的一次性遍历。在使用可迭代对象时,通常不需要调用iter()或自己处理迭代器对象。用for语句自动为来完成这一工作,它创建一个临时的未命名变量,其用于在循环期间保存迭代器。
简而言之,可迭代对象是任何实现了__iter__()方法或__getitem__()方法的类对象。
迭代器
迭代器(Iterator)是指表示数据流的对象。反复调用迭代器的__next__()方法(或将其传递给内置函数next())将返回流中的连续项。当没有更多的数据可用时,将引发StopIteration异常。此时,迭代器对象已经耗尽,任何对其__next__()方法的进一步调用都会再次引发StopIteration。迭代器必须具有返回迭代器对象本身的__iter__()方法,因此每个迭代器也是可迭代的(iterable),并且可以在接受其他可迭代对象的大多数地方使用。
简而言之,迭代器是实现了包含两个迭代器协议方法__next__()和__iter__()的数据流对象。
一个值得注意的例外是试图多次迭代的代码(多次使用同一个迭代器)。容器对象(如列表)每次将其传递给iter()函数或在for循环中使用时都会生成一个新的迭代器。使用迭代器尝试此操作将只返回上一个迭代过程中使用的耗尽的迭代器对象,使其看起来像一个空容器。所以在编写代码中要避免这样的情况出现。
iter函数
另外,需要了解的是内置函数iter() (其在幕后调用__iter__()方法)返回的是一个迭代器对象。所以我们可以说。可迭代对象(iterable)是一个返回迭代器的对象。
为了进一步理解迭代器和可迭代对象,我将后续讲解和代码示例,进一步介绍如下几点关键内容:
- 迭代器协议与循环
- 实现自定义迭代器。