带你看清Java字符串的世界……

开发 后端
Java 基本类型可谓是 Java 世界里使用最频繁的数据类型了。除此之外,有种数据类型你也一定会遇到,它在 Java 世界里使用也相当频繁。它就是字符串!

 前言

Java 基本类型可谓是 Java 世界里使用最频繁的数据类型了。除此之外,有种数据类型你也一定会遇到,它在 Java 世界里使用也相当频繁。它就是字符串!

听到字符串,你是不是想起了字符这种类型。不过在 Java 里,字符和字符串是两种不同的类型。

字符串的定义与形式

字符类型你应该比较熟悉,通过关键词 char 来申明一个字符。

值只能是一个英文字符或者一个中文字符或者是 Unicode 编码,用单引号包住。如下: 

  1. // char 用 ascii 字符赋值  
  2. char charWithAscii = '.' 
  3. char charWithZh = '牛' 
  4. char a = '\u0041';// 值为 A 

而字符串,顾名思义,就是多个字符连接而成的串。通过关键词 String  来声明一个字符串。

值可以是 null 或者空字符串或者单字符串或者多字符串,用双引号包住。如下: 

  1. // null 字符串,未指定地址  
  2. String nullnullStr = null;  
  3. // 空字符串,包含 0 个字符  
  4. String  blankStr = "" 
  5. // 包含一个字符  
  6. String oneCharStr = "A" 
  7. // 包含多个字符,打印 蜗牛666 A  
  8. String multiCharStr = "蜗牛666 \u0041"

你会发现字符串的值可以是 null,因为字符串类型 String 是引用类型,值为 null,就说明值不存在,也就是这个变量不指向任何对象。这也是它和基本类型 char 的区别所在。

那作为引用类型,String 就可以通过 new 的方式声明,比如:

  1. String newnewStr = new String("蜗牛666"); 

另外,你也会发现字符串比字符存储了更丰富的数据,实际上,一个字符串可以存储 0 到任意多个字符。只要把数据内容用双引号包起来就好。

不过,如果你的数据内容本身就有双引号,会发生什么呢?

没错,连编译都过不去!编译器会提示你字符串非法行尾,因为编译器判断的时候,会把中间引号当成字符串结尾,导致第三个引号开始的字符串语法出错。

那此时就要用到转义字符了,这个 case 里可以通过反斜杠 \ 转义中间的引号。

  1. String str = "蜗牛666\""; 

这样就不会报错了。

字符串的存储方式

我们知道,程序在运行时,会针对不同类型的变量数据做运算,最终输出结果。那其实运算过程中的变量数据都是存在栈里边,根据栈先进后出的特点,完成程序的运行逻辑。而对 Java 这种面向对象编程的语言,对象的信息就没放栈里边,而存到了堆里边,栈只存对象的引用地址。

另外,有些数据要求是不可变的,Java 会分配一块常量池出来。

比如 String 的场景。 

  1. String str1 = "蜗牛666" 
  2. String str2 = "蜗牛666" 
  3. String newnewStr1 = new String("蜗牛666");  
  4. String newnewStr2 = new String("蜗牛666"); 

str1 和 str2 就存储在常量池中。而常量池中的数据只有一份,因此 str1 和 str2 其实是指向同一块内存空间。

newStr1 和 newStr2 是通过 new 语法创建的对象,在创建的过程中,Java 会先去常量池中查找是否已有 蜗牛666 对象,如果没有则在常量池中创建一个 蜗牛666 对象,然后在堆中创建一个 蜗牛666 的拷贝对象。

所以 new String("xxx"); 这行代码会产生几个对象?

答案是一个或两个。如果常量池中原来没有 xxx,就是两个。如果有就是一个。

字符串的特点

字符串最大的特点就是不可变性。前边也有提过,字符串在常量池会有一份,常量这个信息就说明字符串具备不可变性了。

我们看下实例,你猜下以下程序会输出什么: 

  1. String strChange = "蜗牛666" 
  2. System.out.println(strChange);  
  3. strChange = "蜗牛888" 
  4. System.out.println(strChange); 

都是 蜗牛666?因为字符串不可变嘛

事实上不是: 

  1. 蜗牛666  
  2. 蜗牛888 

难道 蜗牛666 被改成 蜗牛888 了?

实际上不是,蜗牛666 和 蜗牛888 都在,只是 strChange 的指向变了。

程序在执行 String strChange = "蜗牛666"; 时,JVM 虚拟机先在常量池创建字符串 蜗牛666 ,然后把变量 strChange 指向它。

然后在执行 strChange = "蜗牛888"; 时,JVM 虚拟机先在常量池创建字符串 蜗牛888 ,然后把变量 strChange指向它。

所以你会发现,刚开始的字符串 蜗牛666 还在,只是变量 strChange 不再指向它了。

因此,字符串的不可变特性,是指字符串内容不可变。

另外,字符串的不可变特性,也带来了两个好处。

一个是 String 对象可以缓存哈希码。在 String 类的源码中,你可以看到这么一个属性。 

  1. /** Cache the hash code for the string */  
  2. private int hash; // Default to 0 

hash 的值是基于字符串的每个字符计算得出。那字符串的不可变特性,就能保证 hash 的唯一性,因此可以缓存起来,被频繁使用。这也是性能优化的一种手段。

另外一个就是字符串的不可变特性保证了很多场景下的安全。

很多 Java 类库都会选择 String 作为参数,像文件路径 path 这些。如果 String 会经常改变,那就有各种安全隐患。

字符串的常用场景

比较

和基本类型相比,字符串也有比较的能力。比如下面的比较方式。 

  1. String equalChar = "蜗牛" 
  2. String euqalCharCompare = "蜗牛" 
  3. System.out.println(equalChar == euqalCharCompare); 

直接常量定义的方式,没有问题,会输出 true 。但如果通过 new 的方式定义那就容易出错了,比如以下的代码,你知道输出什么么? 

  1. String equalMethod = new String("蜗牛");  
  2. String euqalMethodCompare = new String("蜗牛");  
  3. System.out.println(equalMethod == euqalMethodCompare); 

会输出 false ,而这是不符合我们预期的。为什么会这样呢?

因为 == 对于引用类型而言,比较的是引用的地址。而上边两个字符串都是 new 出来的新对象。引用地址自然不同。

那如果想只比较内容怎么做呢?可以使用 Java String 自带的 equals 方法!

  1. System.out.println(equalMethod.equals(euqalMethodCompare)); 

此时就能正常输出 true 了。

拼接

最简单的拼接就是用 + 连接符,比如以下代码。 

  1. /**  
  2.  * 字符串连接  
  3.  *  
  4.  * @author 蜗牛  
  5.  * @from 来源:蜗牛互联网  
  6.  */  
  7. public class StringConnect {   
  8.     public static void main(String[] args) {  
  9.         String name = "蜗牛" 
  10.         String age = "18" 
  11.         String profile = name + " " + age;  
  12.         System.out.println(profile);  
  13.     }  

运行代码会输出:

  1. 蜗牛 18 

我们可以通过反编译看下,这段代码发生了什么,输入命令: 

  1. javap -c StringConnect 

我们看到有如下输出:

你会发现,加号连接符实际上是 Java 编译器的优化,底层是用了 StringBuilder 这个类,它的 append 方法就起了拼接的效果。

如果拼接的字符串数量有限,相对固定,建议用加号连接符,这样一行代码搞定!

如果拼接的字符串有相关的逻辑,比如循环拼接,字符串数量不太固定,那建议用 StringBuilder 这个工具类。

另外, StringBuilder 是线程不安全的,如果你是多线程开发环境,为了保证程序不出错,可以用它的兄弟类 StringBuffer ,这个类方法和 StringBuilder 一致,只是增加了线程安全的能力。 

 

责任编辑:庞桂玉 来源: Java技术栈
相关推荐

2021-03-08 08:23:24

Java字符串截取

2021-07-30 06:22:37

C++字符型字符串

2009-06-23 14:13:00

Java字符串

2023-03-07 10:07:04

JavaScript字符串反斜杠

2011-06-08 15:45:41

字符串JAVA

2010-09-09 11:48:00

SQL函数字符串

2013-06-24 15:16:29

Java字符串拼接

2021-05-28 10:02:05

Swift5 字符串String

2024-04-01 08:41:39

字符串.NET

2019-12-17 15:49:44

Java语言字符串

2009-06-30 14:16:37

截取字符串

2020-12-21 08:11:46

JVMJDKJRE

2011-12-20 10:28:01

Java字符串

2010-06-28 15:18:51

SQL Server

2011-07-21 15:36:40

JAVA

2022-07-18 08:18:11

字符JavaJDK

2011-06-03 13:03:03

JAVA

2023-12-15 10:27:01

暴力匹配算法Python字符串

2013-05-06 10:54:08

字符串字符串匹配KMP算法

2010-11-26 09:51:54

MySQL字符串
点赞
收藏

51CTO技术栈公众号