C# foreach语句不仅仅只是do...while或者for循环语句的一个变体。它会为我们的集合产生***的遍历代码。实际上,foreach语句的定义和.NET框架中的集合接口密切相关。对于一些特殊的集合类型,C#编译器会产生具有***效率的代码。遍历集合时,我们应该使用C# foreach语句,而非其他的循环构造。例如,对于下面三种循环:
- int [] foo = new int[100];
- // 循环1:
- foreach ( int i in foo)
- Console.WriteLine( i.ToString( ));
- // 循环2:
- for ( int index = 0;
- index < foo.Length;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
- // 循环3:
- int len = foo.Length;
- for ( int index = 0;
- index < len;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
对于当前和将来的C#编译器(版本1.1及其以上版本),第1个循环产生的代码***,而且需要键入的字符也最少,因此程序员的开发效率也比较高。(不过在C# 1.0编译器下,第1个循环产生的代码效率较慢,第2个循环产生的代码效率***。)大多数C和C++程序员认为效率***的第3循环,反而是最坏的选择。通过将Length变量放到循环之外,我们实际上阻碍了JIT编译器移除循环中的范围检查。
C#代码运行在一个安全、托管的环境中。每一个内存位置都会被检查,包括数组索引。事实上,第3个循环所产生的代码和如下的代码等效:
- // 循环3, 和编译器产生的代码等效:
- int len = foo.Length;
- for ( int index = 0;
- index < len;
- index++ )
- {
- if ( index < foo.Length )
- Console.WriteLine( foo[index].ToString( ));
- else
- throw new IndexOutOfRangeException( );
- }
JIT和C#编译器并不“喜欢”我们用这种方式来帮助它们。将Length属性放到循环之外只会让JIT编译器做更多的工作,产生的代码也更慢。CLR会确保我们写的代码不会滥用变量拥有的内存。CLR会在访问每一个特定数组元素之前,产生一个数组界限(并非上面的len变量)测试。如果我们像上面那样写代码,每一个数组界限测试会被执行两次。
在循环的每一次迭代中,我们都要对数组索引做两次检查。第1个循环和第2个循环更快的理由在于C#编译器和JIT编译器可以确保循环中的数组界限是安全的。只要循环变量不是数组的Length属性,每一次迭代时都会执行数组界限检查。
对于1.0版本的C#编译器,在数组上使用foreach语句产生的代码比较慢的原因在于装箱操作(有关装箱的详细讨论,参见条款17)。在.NET中,数组是类型安全的。1.1版本之后的C#编译器会为数组与其他集合产生不同的IL。在1.0版本的编译器产生的代码中,在数组上使用foreach语句实际上是通过IEnumerator接口来遍历数组,而这会导致装箱与拆箱操作:
- IEnumerator it = foo.GetEnumerator( );
- while( it.MoveNext( ))
- {
- int i = (int) it.Current; // 这里将出现装箱和拆箱。
- Console.WriteLine( i.ToString( ) );
- }
相反,对于1.1版本之后的C#编译器,在数组上使用foreach语句将产生类似如下的构造:
- for ( int index = 0;
- index < foo.Length;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
由于foreach语句总会产生***的代码,所以我们不必刻意去记忆哪种构造会产生***效的循环构造——foreach和编译器会为我们做这些工作。
如果效率还不能说服大家,那么来看看语言互操作的情况。总有一些人(其中的大多数人都有使用其他一些编程语言的经验)坚定地认为数组的起始索引变量应该从1(而非0)开始。不管我们怎么费力地说服他们,都无法改变他们的这个习惯。.NET开发组在这个问题上已经尽力了。我们可以在C#语言中用如下的初始化方式,来获得一个起始索引不为0的数组:
- // 创建一个一维数组,范围为 [ 1 .. 5 ]。
- Array test = Array.CreateInstance( typeof( int ),
- new int[ ]{ 5 }, new int[ ]{ 1 });
很多人面对这样的代码可能会退缩,转而使用起始索引为0的数组。但是总有一些人对此比较顽固。不管你怎么努力,这些人都会坚持从1开始索引数组。幸运地是,在这个问题上我们可以使用foreach语句来蒙混编译器:
- foreach( int j in test )
- Console.WriteLine ( j );
这里的foreach语句知道如何获得数组的上下界,因此就不必烦劳我们——而且其效率和我们手写的for循环一样快,不管其他人采用的数组下界是多少,我们使用这种做法都可以正常工作。
另外,C# foreach语句还可以为我们带来其他好处。其中的循环变量是只读的——也就是说我们不能替换foreach语句中的集合对象。而且还存在一个显式强制转型。如果集合中保存的对象类型不正确,迭代语句将抛出一个异常。
对于多维数组,foreach语句也有类似的好处。假设我们要创建一个棋盘,我们可能会编写如下的两段代码:
- private Square[,] _theBoard = new Square[ 8, 8 ];
- // 另外地方的代码:
- for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )
- for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )
- _theBoard[ i, j ].PaintSquare( );
使用foreach语句,我们可以将上面的遍历代码做如下的简化:
- foreach( Square sq in _theBoard )
- sq.PaintSquare( );
不管数组的维数是多少,foreach语句都会产生正确的遍历代码。如果我们之后又要做一个3D棋盘,上面的foreach循环仍然会正常工作。而其他手写的循环代码就需要更改了:
- for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )
- for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )
- for( int k = 0; k < _theBoard.GetLength( 2 ); k++ )
- _theBoard[ i, j, k ].PaintSquare( );
事实上,对于在每一维上拥有不同下界的多维数组来讲,foreach循环也会正常工作。这里我就不再编写这样的示例代码了。如果有人使用那样的集合,我们要知道foreach语句也能处理它。
如果我们刚开始使用的是数组,后来又需要转向其他数据结构,foreach语句允许我们不用更改绝大多数代码,从而保持代码的灵活性。假设我们刚开始有如下一个简单的数组:
- int [] foo = new int[100];
但过了一段时间后,我们发现该数组无法方便地处理我们需要的某种功能。这时候,我们选择将数组更改为ArrayList:
- // 设置初始大小:
- ArrayList foo = new ArrayList( 100 );
这样更改之后,任何手写的for循环代码都将遭到破坏:
- int sum = 0;
- for ( int index = 0;
- // 下面的代码将不能编译:ArrayList 使用Count,而非Length。
- index < foo.Length;
- index++ )
- //下面的代码将不能编译:foo[ index ] 是一个object,而非int。
- sum += foo[ index ];
而使用foreach语句,它会编译为不同的代码,自动将每一个操作数强制转换为正确的类型。我们在代码上无需做任何更改。事实上,使用foreach语句不仅可以更改为标准集合类型——任何集合类型都可以使用foreach。
如果我们支持.NET环境为集合所定义的规则,用户便可以使用foreach来遍历我们的类型成员。要让foreach语句将一个类看做集合类型,该类必须拥有一些属性。总共有3种方式可以使一个类成为集合类:类型具备一个公有的GetEnumerator()方法;类型显式实现了IEnumerable接口;类型实现了IEnumerator接口。
***,C# foreach语句还会为我们在资源管理方面带来额外的好处。IEnumerable接口只包含一个方法:GetEnumerator()。在一个支持IEnumerable接口的类型上使用foreach语句会产生类似如下的代码(会有一些优化):
- IEnumerator it = foo.GetEnumerator( ) as IEnumerator;
- using ( IDisposable disp = it as IDisposable )
- {
- while ( it.MoveNext( ))
- {
- int elem = ( int ) it.Current;
- sum += elem;
- }
- }
如果编译器可以确定类型对IDisposable接口的实现情况,那么它就会自动优化finally块中的语句。
综上所述,foreach是一个非常有用的语句。它会使用***效的构造为“数组的上下界索引”、“多维数组遍历”和“操作数转型”产生正确的代码,并且产生的是***效率的循环结构。它是遍历集合的***方式。使用它,我们编写的代码将比较“经久耐用”,而且在刚开始编写的时候也比较简单。使用foreach为我们带来的开发效率提升可能很少,但是随着时间的推移,它的效益会不断增长。
C# foreach语句的深入了解的内容就向你介绍到这里,希望对你了解和学习C# foreach语句有所帮助。
【编辑推荐】