原来是这样:C#中字符串的内存分配与驻留池

开发 后端
当有多个字符串变量包含了同样的字符串实际值时,CLR可能不会为它们重复地分配内存,而是让它们统统指向同一个字符串对象实例。

刚开始学习C#的时候,就听说CLR对于String类有一种特别的内存管理机制:有时候,明明声明了两个String类的对象,但是他们偏偏却指向同一个实例。如下:

  1. String s1 = "Hello";  
  2. String s2 = "Hello";        //s2和s1的实际值都是  
  3. “Hello”bool same = (object) s1 == (object) s2;     
  4.  //这里比较s1、s2是否引用了同一个对象实例                                                              
  5.   //所以不能写作bool same = s1 == s2;     
  6. //因为String类重载了==操作符来比较String对象包含的实际值 

这里的same会被赋值为true。也就是说s1真的和s2引用了同一个String对象。当然,应该注意到的是s1和s2都被统一赋值为同一个字符串“Hello”,这才是出现上述情况的原因。

现在我们初步得出结论,当有多个字符串变量包含了同样的字符串实际值时,CLR可能不会为它们重复地分配内存,而是让它们统统指向同一个字符串对象实例。(这里我说了“可能”,是因为某些情况下,确实也会发生同一个字符串实际值在内存中有多份副本同时存在。请继续往下看。)

我们知道,String类有很多特别的地方,其中之一就是它是“不会改变的”(immutable)。这说明在我们每次对一个String对象进行操作时(比如说使用Trim,Replace等方法),并不是真的对这个String对象的实例进行修改,而是返回一个新的String对象实例作为操作执行的结果。String对象的实例一经生成,到死都不会被改变了!

基于String类这样的特性,CLR让表示相同的字符串实际值的变量指向同一个String事例,就是完全合理的了。因为利用任何一个对String实例的引用所进行的修改操作都不会切实地影响到该实例的状态,也就不会影响到其他所有指向该实例的引用所表示的字符串实际值。CLR如此管理String类的内存分配,可以优化内存的使用情况,避免内存中包含冗余的数据。

为了实现这个机制,CLR默默地维护了一个叫做驻留池(Intern Pool)的表。这个表记录了所有在代码中使用字面量声明的字符串实例的引用。这说明使用字面量声明的字符串会进入驻留池,而其他方式声明的字符串并不会进入,也就不会自动享受到CLR防止字符串冗余的机制的好处了。这就是我上文提到的“某些情况下,确实也会发生同一个字符串实际值在内存中有多份副本同时存在”的例子。请看这个例子:

  1. StringBuilder sb = new StringBuilder();  
  2. sb.Append("He").Append("llo");  
  3. string s1 = "Hello";  
  4. string s2 = sb.ToString();  
  5. bool same = (object) s1 == (object) s2; 

这时same就不是true了,因为虽然s1,s2表示的是相同的字符串,但是由于s2不是通过字面量声明的,CLR在为sb.ToString()方法的返回值分配内存时,并不会到驻留池中去检查是否有值为“Hello”的字符串已经存在了,所以自然不会让s2指向驻留池内的对象。

为了让编程者能够强制CLR检查驻留池,以避免冗余的字符串副本,String类的设计者提供了一个名为Intern的类方法。下面是该方法的一个示例:

  1. StringBuilder sb = new StringBuilder();  
  2. sb.Append("He").Append("llo");  
  3. string s1 = "Hello";  
  4. string s2 = String.Intern(sb.ToString());  
  5. bool same = (object) s1 == (object) s2; 

好了,same又是true了。Intern方法接受一个字符串作为参数,它会在驻留池中检查是否存在参数所表示的字符串。如果存在,则返回那个驻留池中的字符串的引用;否则向驻留池中加入一个新的表示相同值的字符串,并返回这个字符串的引用。不过要注意的是,就算Intern方法在驻留池中找到了相同值的字符串,也不能让您省却一次字符串内存分配的操作,因为作为参数的字符串已经被分配了一次内存了。而使用Intern方法的好处在于,如果Intern方法在驻留池中找到了相同值的字符串,此时虽然在内存中存在两份该字符串的副本(一份是参数,一份是驻留池中的),但是随着时间的流逝,参数所引用的那个副本会被垃圾回收掉,这样对于该字符串内存中就不存在冗余了。

当您的程序中存在某个方法,可以根据不同的上下文环境创建并返回一个很长的字符串,而在程序运行的过程中它有会经常返回同样的字符串时,您可能就要考虑考虑使用Intern方法来提高内存的利用率了。不过同样值得注意的是,使用Intern方法让一个字符串存活于驻留池中也有一个副作用:即使已经不存在任何其它引用指向驻留池中的字符串了,这个字符串仍然不一定会被垃圾回收掉。也就是说即使驻留池中的字符串已经没有用处了,它可能也要等到CLR终结时才被销毁。当您使用Intern方法的时候,也应该考虑到这个特殊的行为。

原文链接:http://www.cnblogs.com/instance/archive/2011/05/24/2056091.html

【编辑推荐】

  1. 相同中的不同:Java程序员应该停止低看C#
  2. 浅析C#延迟加载的运行机制和应用场景
  3. 关于C#代码规范的两点疑惑
  4. 关于C#委托你不可不知的几件事
  5. C#用Activex实现Web客户端读取RFID功能
责任编辑:陈贻新 来源: posted的博客
相关推荐

2022-12-14 07:32:40

InnoDBMySQL引擎

2024-04-30 08:22:51

Figma图形编辑变换矩阵

2018-04-02 15:13:21

网络

2023-02-15 08:17:38

2021-09-07 09:23:07

C++字符串算法

2022-05-05 08:55:12

工业物联网IIoT

2023-05-22 15:58:11

2024-02-06 09:30:25

Figma矩形矩形物理属性

2020-05-26 08:52:36

Java JVM多态

2020-11-24 06:20:02

Linux日志文件系统

2016-10-12 08:54:24

2009-09-02 16:21:20

C#字符串

2014-07-21 10:32:52

苹果公司实习

2009-08-07 14:15:21

C#字符串分割

2009-08-24 13:04:44

操作步骤C#字符串

2009-08-24 17:06:37

C#字符串

2009-08-06 16:01:09

C#字符串函数大全

2009-08-26 13:24:54

C#字符串

2009-08-07 14:22:56

C#字符串搜索

2009-08-07 14:34:33

C#模式字符串
点赞
收藏

51CTO技术栈公众号