毫无疑问 String 是作为一个 Java 开发工程师天天都需要打交道的类,那么如果问你 String 字符串的最大长度是多少你知道吗?
有的小伙伴可能想都没想,就直接回答 65535,那么问题来了,真的吗?今天阿粉就带你研究一下。
首先对于 String 我们可以有下面几种用法:
- 定义一个 String 类型的变量:private static final String STRING_TEST = "xxxxxxxxxxx"; 或者 String newString = "newString";
- 通过在方法中定义 String 类型的变量,通过字节流创建字符串:byte[] bytes = new byte[length];String s = new String(bytes);;
有朋友可能会说,这两种不都是定义一个字符串变量,有什么区别吗?表面上看是没什么区别,但是实际上区别还是蛮大的。
首先第一种方式定一个静态类变量,或者普通的字符串变量,这种形式字符串是存放在栈中的;而第二种方式字符串是存放在堆中的。这个时候有的小伙伴又要问了,这存在不同的地方有什么关系呢?首先这关系可大了!
当字符串存放在栈中的时候,根据 class 文件的结果规范,我们可以看到所采用的的存储格式是这样的:
- CONSTANT_Utf8_info {
- u1 tag;
- u2 length;
- u1 bytes[length];
- }
其中 u2 是一种类似于Java 中int 一样的数据类型,只是表示的是一个 2 个字节的数据类型,只不过 int 是 4 个字节,这也就意味着允许的最大长度为 65535 个字符。所以我们可以得出一个结果,当字符串存放在栈内存中的时候,字符串的长度可以达到 65535。
看到这里小伙伴又不耐烦了,说到:你看吧,我就说是 65535 吧,还不信。
别急,到这里我们才说了一半,接下来我们在看看第二种方式。很显然第二种方式不管是通过字节流的方式,还是 new 一个对象,存放的位置都是早 Java 的堆内存中,而且通过 String 的源码,我们可以看到了,底层是通过一个 char[] 数组来存放的。
- private final char value[];
那么我们就知道了,字符传的大小就跟数组的长度有直接关系了,另外在定义数组长度的时候,我们最多只能定义 int 类型的最大值,也就是Integer.MAX_VALUE = 0x7fffffff; 而且 String 类的 length() 方法的返回值也可以看出来,返回的类型是 int ,数值最大也是Integer.MAX_VALUE = 0x7fffffff;
- /**
- * Returns the length of this string.
- * The length is equal to the number of <a href="Character.html#unicode">Unicode
- * code units</a> in the string.
- *
- * @return the length of the sequence of characters represented by this
- * object.
- */
- public int length() {
- return value.length;
- }
所以看到这里,我们又得出了一个结果,**当字符串存放在堆内存的时候,最大的长度为 Integer.MAX_VALUE = 0x7fffffff; **。不过需要注意的是,这个数值是理论上的,其实很多虚拟机会在数组中加入一些字符,所以实际的数值是达不到这么多,另外我们在 ArrayList 中也可以看到这个验证,这里定义的最大值就是Integer.MAX_VALUE - 8; 而不直接采用最大值。
此外上面说的最大值是在我们的虚拟机有这么大的内存的前提下,如果说我们的虚拟机配置的内存比这个要小,那也是达不到这么大。我们可以通过 JVM 参数来配置虚拟机的内存大小,-Xms512m 设置堆内存初始值大小。-Xmx1024m 设置堆内存最大值。下面是阿粉在自己的电脑上测试的效果,可以看到,当开始提示Requested array size exceeds VM limit,后面因为阿粉的电脑内存不够了,所以一直分配失败,达不到最大值,只能降低长度了。
另外还要注意一个点,那就是我们在这里说的长度针对的都是英文字符,如果是是中文的话是没有那么长的,那么如果对应中文的话字符串会有多长呢?