细说Array数组

开发 后端
Array数组有很多值得学习的地方,本篇文章,笔者将为大家细说Array。

  本文将对Array数组的各个方面做一个比较简略地介绍,其中包括数组的基础知识,分类,以及效率性能问题。

  1. 数组大局观

  数组是一个引用类型,也就是意味着数组的内存分配在托管堆上,并且我们在栈上维护的是他的指针而并非真正的数组。接下来我们分析下数组的元素,其中的元素无外乎是引用类型和值类型。当数组中的元素是值类型时,不同于int i;这样的代码。数组会根据数组的大小自动把元素的值初始化为他的默认值。例如:

  1. static void Main(string[] args)  
  2.   {  
  3.   int[] intArray = new int[3];  
  4.   foreach(int i in intArray)  
  5.   {  
  6.   Console.WriteLine(i);  
  7.   }  
  8.   DateTime[] dtArray = new DateTime[3];  
  9.   foreach (DateTime i in dtArray)  
  10.   {  
  11.   Console.WriteLine(i);  
  12.   }  
  13.   }  

  结果如下:

  当数组中的元素是引用类型时,实际上数组中的元素是一个指向对象实际内存空间的指针,占用4Bytes的空间。

  2. 谈谈零基数组

  从学C语言时起,相信老师就会对我们讲,数组的***个索引是0,而不是1。但是在C#中,我们可以去构造一个非零基数组,在这一节,我们就来把这个说透。

  在常规意义上,我们初始化一个数组,都默认是零基数组,这也使得数组成为了字符串后再一个初始化时特殊的类型。正如我们知道的一样,初始化一个字符串时,对应的IL指令是newstr,同样,初始化一个零基数组对应的IL指令是newarr。

  当我们希望构造一个非零基数组时,我们可以以下的语句来做到:

  1. static void Main(string[] args)  
  2.   {  
  3.   Array intArr = Array.CreateInstance(typeof(Int32), new int[] { 5 }, new int[] { 1 });  
  4.   Console.WriteLine(intArr.GetValue(1).ToString());  
  5.   Console.WriteLine(intArr.GetValue(0).ToString());  
  6.   }  

  得到的测试结果便如下:

  于是便证明,我们初始化了一个非零基数组。此外,延伸一下,我们还应该通过这个记住以下两个方法:

  1. static void Main(string[] args)  
  2.   {  
  3.   Array intArr = Array.CreateInstance(typeof(Int32), new int[] { 5 }, new int[] { 1 });  
  4.   Console.WriteLine(intArr.GetLowerBound(0));  
  5.   Console.WriteLine(intArr.GetUpperBound(0));  
  6.   }  

  得到的测试结果如下:

 

  3. 谈谈效率问题

  相信会有好多阴谋论者说,C#是个类型安全的语言,也就是意味着我循环时每次访问一次数组的元素,那么就要检查一次该索引是否会造成数组越界,于是就造成了一定的性能损失。那么在这里,我们就把这个问题说透。

  我们在这里把数组分成零基数组,非零基数组,多维数组,交错数组四种情况来分别讨论这个问题。

  零基数组是.NET中提倡使用的类型,并且初始化时提供了特殊的IL指令newarr则充分说明了他在.NET中的特殊性,自然.NET Framework也会为其提供很大的优化待遇。在循环访问数组时,如这样的代码:

  1. static void Main(string[] args)  
  2.   {  
  3.   int[] intArr = new int[5];  
  4.   for (int i = 0; i < 4; i++)  
  5.   {  
  6.   //Some Method  
  7.   }  
  8.   }  

  JIT编译器只会在循环开始之前检查一次4和intArr.GetUpperBound的大小关系,之后便不会对其进行干预。也就是说JIT编译器只对其检查一次安全,因此带来的性能损失是非常小的。

  而对于非零基数组,我们来比较这样两段代码:

  1. static void Main(string[] args)  
  2.   {  
  3.   Array intArr = Array.CreateInstance(typeof(Int32), new int[] { 5 }, new int[] { 1 });  
  4.   Console.WriteLine(intArr.GetValue(1).ToString());  
  5.   Console.WriteLine(intArr.Length);  
  6.   //  
  7.   int[] intArr1 = new int[5];  
  8.   Console.WriteLine(intArr1[1]);  
  9.   Console.WriteLine(intArr1.Length);  
  10.   }  

  其实两者创建的几乎是相同的数组,调用的也几乎是一样的方法,但是我们看下IL却会发现两者有着惊人的不同,首先是非零基数组的IL:

  接下来是零基数组的:

  我们可以发现,对于非零基数组中的大部分操作,.NET Framework都提供了对应的IL指令,我们也可以理解为.NET Framework为其提供了特殊的优化。

  当然,实际上,正如CLR via C#所说的一样:.NET Framework对应非零基数组没有任何方面的优化,每次访问都需要检查其上限和下限与索引之间的关系。效率的损耗是必然的。

  事实上,当我们测试这样一段代码时,也会发现其实零基数组和非零基数组的区别是很大的:

  1. static void Main(string[] args)  
  2.   {  
  3.   Array intArr = Array.CreateInstance(typeof(Int32), new int[] { 5 }, new int[] { 1 });  
  4.   Console.WriteLine("intArr的?类à型í是?:o{0}", intArr.GetType());  
  5.   //  
  6.   int[] intArr1 = new int[5];  
  7.   Console.WriteLine("intArr1的?类à型í是?:o{0}", intArr1.GetType());  
  8.   }  

  得到的结果如下:

  接下来我们再来简单地说下多维数组和交错数组。

  多维数组和非零基数组一样,都没有受到.NET Framework的特殊优待。

  而交错数组,其实就是数组中的数组,因此效率实际上取决于数组中的数组是零基数组还是非零基数组。

  那接下来的一节,我们来具体探讨一下交错数组和多维数组的区别和应用。

  4. 多维数组和交错数组

  考虑到两个词的翻译问题,在这里给出两个词的英文:

  多维数组:Multi-dimensional Array。

  交错数组:Jagged Array。

  好,下面步入正题。

  首先从二者的内存分布说起。

  多维数组是一个整体的数组,因此他在内存中占据一个整体的托管堆内存块。

  而交错数组实际上是数组中的数组,因此我们用二维交错数组来举例,其内存如图所示:

 

  也就是说,如果是一个3*100的数组,也就是说需要初始化101次数组,当数组的元素更加多的时候,那创建和垃圾回收将带来巨大的效率损失。

  因此,也就是说:交错数组的效率瓶颈在于创建和销毁上,而并非类型安全检查上。

  于是,我们就可以得出这样的结论:

  当一次创建,多次访问时,我们应该创建交错数组。

  当一次创建,一次访问时,我们应该创建多维数组。

  5. 用代码改善效率

  上面说到了,访问非零基数组和多维数组的效率是比较低的,对于非零基数组,我们的应用比较少,但是多维数组,相信每个人都或多或少有着一定的应用,那么面对其性能问题,我们该怎么办呢?

  我们先来想想,多维数组的访问,性能瓶颈在安全检查上。在C语言中,为什么没有这样的问题,对,因为C语言不会做这样的检查。于是,相信聪明的大家都会想到不安全代码。

  改善多维数组以及非零基数组的效率问题,我们就用不安全代码。

  1. static unsafe void Main(string[] args)  
  2.   {  
  3.   int[,] intArr = new int[3, 3];  
  4.   for (int i = 0; i < 3; i++)  
  5.   {  
  6.   for (int j = 0; j < 3; j++)  
  7.   {  
  8.   intArr[i, j] = i * 3 + j;  
  9.   }  
  10.   }  
  11.   fixed (int* p = &intArr[0, 0])  
  12.   {  
  13.   for (int i = 0; i < 3; i++)  
  14.   {  
  15.   int baseOffset = i * 3;  
  16.   for (int j = 0; j < 3; j++)  
  17.   {  
  18.   Console.WriteLine(baseOffset + j);  
  19.   }  
  20.   }  
  21.   }  
  22.   }  

  这里,我们又见到了C语言中熟悉的指针,相信不需要多加介绍了。这里唯一需要注意的就是fixed,由于在垃圾回收时采用的是代机制+压缩机制,因此其内存地址很可能发生改变,因此我们应该讲数组的内存地址锁住,防止我们访问到其他的内存地址而造成我们读取数据的错误。

  6. 对零基数组的精益求精

  当然,即使是零基数组,我们依然在托管堆上为其分配了内存空间。如果对性能要求极高,我们知道创建一个对象也是有着一定的时间损耗,其中包括分配内存空间,同步块索引,以及指向下一块内存空间的指针等一系列复杂的操作。那么我们就放弃掉托管堆这个东东,而直接在栈中来创建这个数组,这样又省去了很多时间,从而达到了和C语言相同的效果,代码如下:

  1. static unsafe void Main(string[] args)  
  2.   {  
  3.   int* intArr=stackalloc int[10];  
  4.   for (int i = 0; i < 10; i++)  
  5.   {  
  6.   intArr[i] = i;  
  7.   }  
  8.   for (int i = 0; i < 10; i++)  
  9.   {  
  10.   Console.WriteLine(intArr[i]);  
  11.   }  
  12.   }  

  这样,效率就进一步提高了,对于二维数组,我们一样可以如此创建。其代码与C语言完全等同。我在这里就不继续演示了。

  编者后话:在文章的***,介绍的是用不安全代码来访问创建数组来提高性能。不过在实际工作中,如果对性能没有特别高的要求,则没必要用不安全代码来操作数组,因为其很可能因为你的一些失误而带来其他的一些安全问题,并且对代码的可读性也是个比较大的伤害,这就有些得不偿失了。

【编辑推荐】

  1. JS中Array数组的三大属性用法揭秘
  2. 常用C# Arraylist的介绍
  3. 浅析C# ArrayList
  4. C语言封送结构体数组
  5. 详细讲述C#数组和指针
责任编辑:韩亚珊 来源: 博客园
相关推荐

2010-10-09 15:20:23

MySQL数组函数

2009-11-16 15:07:23

PHP数组函数库

2009-11-16 15:16:59

PHP数组

2011-07-18 09:48:10

jQuery

2009-11-24 17:52:46

PHP函数in_arr

2010-10-09 09:26:59

Array数组JS

2010-09-29 14:41:42

Suse DHCP配置

2021-11-10 11:37:48

Spring整合 Mybatis

2009-09-17 10:04:32

LINQ存储过程

2014-12-08 09:26:52

HTTP

2014-11-21 10:36:26

VLANTrunk

2021-02-07 07:52:07

数组 JavaScript结构

2009-11-24 17:45:47

PHP数组排序函数ar

2009-11-24 18:08:39

PHP函数array_

2009-11-25 14:44:34

PHP函数array_

2009-11-24 18:18:21

PHP函数array_

2024-08-30 08:35:03

JavaScript切片数组

2010-08-06 12:47:18

Linux NFS

2010-09-02 09:07:53

2011-04-18 13:07:58

点赞
收藏

51CTO技术栈公众号