从String中移除空白字符的多种方式!?差别竟然这么大!

开发 开发工具
字符串,是Java中最常用的一个数据类型了。我们在日常开发时候会经常使用字符串做很多的操作。比如字符串的拼接、截断、替换等。

[[340979]]

字符串,是Java中最常用的一个数据类型了。我们在日常开发时候会经常使用字符串做很多的操作。比如字符串的拼接、截断、替换等。

这一篇文章,我们介绍一个比较常见又容易被忽略的一个操作,那就是移除字符串中的空格。

其实,在Java中从字符串中删除空格有很多不同的方法,如trim,replaceAll等。但是,在Java 11添加了一些新的功能,如strip、stripLeading、stripTrailing等。

大多数时候,我们只是使用trim方法来删除多余的空格。但是好像很多人并没有去思考过,是否有更好的方式呢?

当然,trim()在大多数情况下都工作得很好,但是Java中有许多不同的方法。每一种都有自己的优点和缺点。我们如何决定哪种方法最适合我们呢?

接下来我们将介绍几种方法,并对比下他们的区别和优缺点等。

在java中从字符串中删除空格的不同方法

首先,我们来看一下,想要从String中移除空格部分,有多少种方法,作者根据经验,总结了以下7种(JDK原生自带的方法,不包含第三方工具类库中的类似方法):

  • trim() : 删除字符串开头和结尾的空格。
  • strip() : 删除字符串开头和结尾的空格。
  • stripLeading() : 只删除字符串开头的空格
  • stripTrailing() : 只删除字符串的结尾的空格
  • replace() : 用新字符替换所有目标字符

replaceAll() : 将所有匹配的字符替换为新字符。此方法将正则表达式作为输入,以标识需要替换的目标子字符串

replaceFirst() : 仅将目标子字符串的第一次出现的字符替换为新的字符串

需要注意的最重要的一点是,在Java中String对象是不可变的,这意味着我们不能修改字符串,因此以上所有的方法我们得到的都是一个新的字符串。

接下啦,我们分别针对以上这几个方法学习下用法,了解下其特性。

PS:本文代码都是使用在线运行工具(https://www.jdoodle.com/online-java-compiler/ )执行的,因为我的测试机并未安装Java 11,并且Unicode字符也不完整。如果大家也想实验,建议使用在线工具,选择对应的JDK即可。

trim

trim()是Java开发人员最常用的删除字符串开头和结尾的空格方法。其用法也比较简单:

  1. public class StringTest { 
  2.  
  3.     public static void main(String[] args) { 
  4.  
  5.         String stringWithSpace = "   Hollis   Is   A   Java   Coder   "
  6.  
  7.         StringTest.trimTest(stringWithSpace); 
  8.  
  9.     } 
  10.  
  11.     private static void trimTest(String stringWithSpace){ 
  12.  
  13.         System.out.println("Before trim : \'" + stringWithSpace + "\'"); 
  14.  
  15.         String stringAfterTrim = stringWithSpace.trim(); 
  16.  
  17.         System.out.println("After trim : \'" + stringAfterTrim + "\'"); 
  18.  
  19.     } 
  20.  

输出结果:

  1. Before trim : '   Hollis   Is   A   Java   Coder   ' 
  2.  
  3. After trim : 'Hollis   Is   A   Java   Coder' 

如上,使用trim之后,原字符串中开头和结尾部分的空格内容都被移除掉了。

但是不知道大家有没有思考过,trim方法移除的空白内容都包含哪些东西?除了空格以外,还有其他的字符吗?

其实,trim移除的空白字符指的是指ASCII值小于或等于32的任何字符(' U+0020 '):

其中包含了空格、换行、退格等字符。

strip()

不知道大家有没有注意到,在Java 11的发行版中,添加了新的strip()方法来删除字符串中的前导和末尾空格。

已经有了一个trim方法,为什么还要新增一个strip呢?

这其实是是因为trim方法只能针对ASCII值小于等于32的字符进行移除,但是根据Unicode标准,除了ASCII中的字符以外,还是有很多其他的空白字符的。

而且为了识别这些空格字符,从Java 1.5开始,还在Character类中添加了新的isWhitespace(int)方法。该方法使用unicode来标识空格字符。你可以在http://jkorpela.fi/chars/spaces.html 了解更多关于unicode空格字符的信息。

而在Java 11中新增的这个strip方法就是使用这个Character.isWhitespace(int)方法来判断是否为空白字符并删除它们的:

下面我们来看一个使用strip例子:

  1. public class StringTest { 
  2.  
  3.     public static void main(String args[]) { 
  4.  
  5.       String stringWithSpace ='\u2001' + "  Hollis   Is   A   Java   Coder  " + '\u2001'
  6.  
  7.         System.out.println("'" + '\u2001' + "' is space : " +  Character.isWhitespace('\u2001')); 
  8.  
  9.         StringTest.stripTest(stringWithSpace); 
  10.  
  11.     } 
  12.  
  13.     private static void stripTest(String stringWithSpace){ 
  14.  
  15.         System.out.println("Before strip : \'" + stringWithSpace + "\'"); 
  16.  
  17.         String stringAfterTrim = stringWithSpace.strip(); 
  18.  
  19.         System.out.println("After strip : \'" + stringAfterTrim + "\'"); 
  20.  
  21.     } 
  22.  

我们在字符串前后都增加了一个特殊的字符\u2001,这个字符是不在ASCII中的,经过Character.isWhitespace判断他是一个空白字符。然后使用strip进行处理,输出结果如下:

  1. ' ' is space : true 
  2.  
  3. Before strip : '   Hollis   Is   A   Java   Coder   ' 
  4.  
  5. After strip : 'Hollis   Is   A   Java   Coder' 

所以,Java 11 中的 strip 方法要比trim方法更加强大,他可以移除很多不在ASCII中的空白字符,判断方式就是通过Character.isWhitespace方法。

trim 和 strip 方法的区别

上面我们介绍了两个都可以移除字符串开头和结尾的方法,分别是trim 和 strip,再来对比下他们的区别:

stripLeading() 和 stripTrailing()

stripLeading()和stripTrailing()方法也都是在Java 11中添加的。作用分别是删除字符串的开头的空格以及删除字符串的末尾的空格。

与strip方法类似,stripLeading、stripTrailing也使用Character.isWhitespace(int)来标识空白字符。用法也和strip类似:

  1. public class StringTest { 
  2.  
  3.     public static void main(String args[]) { 
  4.  
  5.       String stringWithSpace ='\u2001' + "  Hollis   Is   A   Java   Coder  " + '\u2001'
  6.  
  7.         System.out.println("'" + '\u2001' + "' is space : " +  Character.isWhitespace('\u2001')); 
  8.  
  9.         StringTest.stripLeadingTest(stringWithSpace); 
  10.  
  11.         StringTest.stripTrailingTest(stringWithSpace); 
  12.  
  13.     } 
  14.  
  15.  
  16.     private static void stripLeadingTest(String stringWithSpace){ 
  17.  
  18.         System.out.println("Before stripLeading : \'" + stringWithSpace + "\'"); 
  19.  
  20.         String stringAfterTrim = stringWithSpace.stripLeading(); 
  21.  
  22.         System.out.println("After stripLeading : \'" + stringAfterTrim + "\'"); 
  23.  
  24.     } 
  25.  
  26.  
  27.      private static void stripTrailingTest(String stringWithSpace){ 
  28.  
  29.         System.out.println("Before stripTrailing : \'" + stringWithSpace + "\'"); 
  30.  
  31.         String stringAfterTrim = stringWithSpace.stripTrailing(); 
  32.  
  33.         System.out.println("After stripTrailing : \'" + stringAfterTrim + "\'"); 
  34.  
  35.     } 
  36.  

输出结果:

  1. ' ' is space : true 
  2.  
  3. Before stripLeading : '   Hollis   Is   A   Java   Coder   ' 
  4.  
  5. After stripLeading : 'Hollis   Is   A   Java   Coder   ' 
  6.  
  7. Before stripTrailing : '   Hollis   Is   A   Java   Coder   ' 
  8.  
  9. After stripTrailing : '   Hollis   Is   A   Java   Coder' 

replace

移除字符串中的空白字符,除了使用trim、strip以外,还有一个办法,那就是使用replace方法把其中的空白字符替换掉。

replace是从java 1.5中添加的,可以用指定的字符串替换每个目标子字符串。

此方法替换所有匹配的目标元素,使用方式如下:

  1.  public class StringTest { 
  2.  
  3.     public static void main(String args[]) { 
  4.  
  5.         String stringWithSpace ="  Hollis   Is   A   Java   Coder  "
  6.  
  7.         StringTest.replaceTest(stringWithSpace); 
  8.  
  9.     } 
  10.  
  11.  
  12.  
  13.     private static void replaceTest(String stringWithSpace){ 
  14.  
  15.         System.out.println("Before replace : \'" + stringWithSpace + "\'"); 
  16.  
  17.         String stringAfterTrim = stringWithSpace.replace(" """); 
  18.  
  19.         System.out.println("After replace : \'" + stringAfterTrim + "\'"); 
  20.  
  21.     } 
  22.  

结果:

  1. Before replace : '  Hollis   Is   A   Java   Coder  ' 
  2.  
  3. After replace : 'HollisIsAJavaCoder' 

可见,以上使用replace方法可以替换掉字符串中的所有空白字符。特别需要注意的是,replace方法和trim方法一样,只能替换掉ASCII中的空白字符。

replaceAll

replaceAll是Java 1.4中添加的最强大的字符串操作方法之一。我们可以将这种方法用于许多目的。

使用replaceAll()方法,我们可以使用正则表达式来用来识别需要被替换的目标字符内容。使用正则表达式,就可以实现很多功能,如删除所有空格,删除开头空格,删除结尾空格等等。

我们只需要用正确的替换参数创建正确的正则表达式。一些正则表达式的例子如下:

  1. \s+   所有的空白字符 
  2.  
  3. ^\s+      字符串开头的所有空白字符 
  4.  
  5. \s+$      字符串结尾的所有空白字符 

注意,在java中要添加/我们必须使用转义字符,所以对于\s+ 我们必须使用 \\s+

  1. public class StringTest { 
  2.  
  3.     public static void main(String args[]) { 
  4.  
  5.         String stringWithSpace ="  Hollis   Is   A   Java   Coder  "
  6.  
  7.         StringTest.replaceAllTest(stringWithSpace," "); 
  8.  
  9.         StringTest.replaceAllTest(stringWithSpace,"\\s+"); 
  10.  
  11.         StringTest.replaceAllTest(stringWithSpace,"^\\s+"); 
  12.  
  13.         StringTest.replaceAllTest(stringWithSpace,"\\s+$"); 
  14.  
  15.     } 
  16.  
  17.  
  18.     private static void replaceAllTest(String stringWithSpace,String regex){ 
  19.  
  20.         System.out.println("Before replaceAll with '"+ regex +"': \'" + stringWithSpace + "\'"); 
  21.  
  22.         String stringAfterTrim = stringWithSpace.replaceAll(regex, ""); 
  23.  
  24.         System.out.println("After replaceAll with '"+ regex +"': \'" + stringAfterTrim + "\'"); 
  25.  
  26.     } 
  27.  

结果:

  1. Before replaceAll with ' ''  Hollis   Is   A   Java   Coder  ' 
  2.  
  3. After replaceAll with ' ''HollisIsAJavaCoder' 
  4.  
  5. Before replaceAll with '\s+''  Hollis   Is   A   Java   Coder  ' 
  6.  
  7. After replaceAll with '\s+''HollisIsAJavaCoder' 
  8.  
  9. Before replaceAll with '^\s+''  Hollis   Is   A   Java   Coder  ' 
  10.  
  11. After replaceAll with '^\s+''Hollis   Is   A   Java   Coder  ' 
  12.  
  13. Before replaceAll with '\s+$''  Hollis   Is   A   Java   Coder  ' 
  14.  
  15. After replaceAll with '\s+$''  Hollis   Is   A   Java   Coder' 

正如我们所看到的,如果将replaceAll()与适当的正则表达式一起使用,它将是非常强大的方法。

replaceFirst

replaceFirst方法也是在java 1.4中添加的,它只将给定正则表达式的第一个匹配项替换为替换字符串。

如果您只需要替换第一次出现的情况,那么这个方法非常有用。例如,如果我们只需要删除前导空格,我们可以使用\\s+或^\\s+。

我们还可以通过使用\\s+$正则表达式使用此方法来删除末尾空格。因为这个表达式将只匹配行的最后一个空格。因此最后的空格被认为是这个方法的第一个匹配。

让我们举一个从字符串中删除前导和尾随空格的例子

  1. public class StringTest { 
  2.  
  3.     public static void main(String args[]) { 
  4.  
  5.         String stringWithSpace ="  Hollis   Is   A   Java   Coder  "
  6.  
  7.         StringTest.replaceFirstTest(stringWithSpace," "); 
  8.  
  9.         StringTest.replaceFirstTest(stringWithSpace,"\\s+"); 
  10.  
  11.         StringTest.replaceFirstTest(stringWithSpace,"^\\s+"); 
  12.  
  13.         StringTest.replaceFirstTest(stringWithSpace,"\\s+$"); 
  14.  
  15.     } 
  16.  
  17.  
  18.     private static void replaceFirstTest(String stringWithSpace,String regex){ 
  19.  
  20.         System.out.println("Before replaceFirst with '"+ regex +"': \'" + stringWithSpace + "\'"); 
  21.  
  22.         String stringAfterTrim = stringWithSpace.replaceFirst(regex, ""); 
  23.  
  24.         System.out.println("After replaceFirst with '"+ regex +"': \'" + stringAfterTrim + "\'"); 
  25.  
  26.     } 
  27.  

结果:

  1. Before replaceFirst with ' ''  Hollis   Is   A   Java   Coder  ' 
  2.  
  3. After replaceFirst with ' '' Hollis   Is   A   Java   Coder  ' 
  4.  
  5. Before replaceFirst with '\s+''  Hollis   Is   A   Java   Coder  ' 
  6.  
  7. After replaceFirst with '\s+''Hollis   Is   A   Java   Coder  ' 
  8.  
  9. Before replaceFirst with '^\s+''  Hollis   Is   A   Java   Coder  ' 
  10.  
  11. After replaceFirst with '^\s+''Hollis   Is   A   Java   Coder  ' 
  12.  
  13. Before replaceFirst with '\s+$''  Hollis   Is   A   Java   Coder  ' 
  14.  
  15. After replaceFirst with '\s+$''  Hollis   Is   A   Java   Coder' 

总结

本文介绍了7种移除字符串中的空白字符的方法。

想要直接移除掉字符串开头的空白字符,可以使用stripLeading、replaceAll和replaceFirst

想要直接移除掉字符串末尾的空白字符,可以使用stripTrailing、replaceAll和replaceFirst

想要同时移除掉字符串开头和结尾的空白字符,可以使用strip、trim

想要移除掉字符串中的所有空白字符,可以使用replace和replaceAll

而Java 11种新增的strip、stripTrailing以及stripLeading方法,可以移除的字符要比其他方法多,他可以移除的空白字符不仅仅局限于ASCII中的字符,而是Unicode中的所有空白字符,具体判断方式可以使用Character.isWhitespace进行判断。

【本文是51CTO专栏作者Hollis的原创文章,作者微信公众号Hollis(ID:hollischuang)】

戳这里,看该作者更多好文

 

 

责任编辑:武晓燕 来源: 51CTO专栏
相关推荐

2015-08-13 10:42:49

.NET空白字符串

2015-10-29 11:55:30

.NET空白字符串方法

2020-11-02 08:35:59

内存数据库Redis

2018-10-08 08:30:59

2019-01-07 09:31:37

程序员测试人员代码

2021-06-10 09:00:33

单例模式数据库

2024-02-22 08:15:49

Spring对象代理

2011-08-05 09:17:47

苹果MySQL移除

2020-09-10 14:14:02

Python散点图分割线

2022-03-18 09:42:54

JavaString

2009-11-23 17:16:54

PHP获取IP

2024-01-23 08:47:13

BeanSpring加载方式

2023-01-12 16:57:39

ChatGPT

2020-06-01 08:04:18

三目运算符代码

2020-05-20 17:35:40

JavaString面试官

2020-11-30 14:17:31

iPhone 12苹果成本

2012-01-01 19:30:37

Siri

2009-11-26 18:28:07

PHP函数trim()

2020-12-01 10:18:16

RabbitMQ

2021-04-23 08:20:04

Linux运维Linux系统
点赞
收藏

51CTO技术栈公众号