透过源码学优化：String字符串性能优化的方案，你知道几种？_技术 _ 頭條網

String字符串是系统里最常用的类型之一，在系统中占据了很大的内存，因此，高效地使用字符串，对系统的性能有较好的提升。

针对字符串的优化，我在工作与学习过程总结了以下三种方案作分享：

一.优化构建的超大字符串

验证环境：jdk1.8

反编译工具：jad

2.验证

先执行一段例子1代码：

<code>public class test3 { public static void main(String[] args) { String str="ab"+"cd"+"ef"+"123"; }}/<code>

执行完成后，用反编译工具jad进行反编译：jad -o -a -s d.java test.class

反编译后的代码：

<code>// Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.// Jad home page: http://www.kpdus.com/jad.html// Decompiler options: packimports(3) annotate // Source File Name: test.javapackage example;public class test{ public test() { // 0 0:aload_0 // 1 1:invokespecial #1 <method> // 2 4:return } public static void main(String args[]) { String str = "abcdef123"; // 0 0:ldc1 #2 <string> // 1 2:astore_1 // 2 3:return }}/<string>/<method>/<code>

案例2：

<code>public class test1 { public static void main(String[] args) { String s = "abc"; String ss = "ok" + s + "xyz" + 5; System.out.println(ss); }}/<code>

用反编译工具jad执行jad -o -a -s d.java test1.class进行反编译后：

<code>// Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.// Jad home page: http://www.kpdus.com/jad.html// Decompiler options: packimports(3) annotate // Source File Name: test1.javapackage example;import java.io.PrintStream;public class test1{ public test1() { // 0 0:aload_0 // 1 1:invokespecial #1 <method> // 2 4:return } public static void main(String args[]) { String s = "abc"; // 0 0:ldc1 #2 <string> // 1 2:astore_1 String ss = (new StringBuilder()).append("ok").append(s).append("xyz").append(5).toString(); // 2 3:new #3 <class> // 3 6:dup // 4 7:invokespecial #4 <method> // 5 10:ldc1 #5 <string> // 6 12:invokevirtual #6 <method> // 7 15:aload_1 // 8 16:invokevirtual #6 <method> // 9 19:ldc1 #7 <string> // 10 21:invokevirtual #6 <method> // 11 24:iconst_5 // 12 25:invokevirtual #8 <method> // 13 28:invokevirtual #9 <method> // 14 31:astore_2 System.out.println(ss); // 15 32:getstatic #10 <field> // 16 35:aload_2 // 17 36:invokevirtual #11 <method> // 18 39:return }}/<method>/<field>/<method>/<method>/<method>/<string>/<method>/<method>/<string>/<method>/<class>/<string>/<method>/<code>

根据反编译结果，可以看到内部其实是通过StringBuilder进行字符串拼接的。

再来执行例3的代码：

<code>public class test2 { public static void main(String[] args) { String s = ""; Random rand = new Random(); for (int i = 0; i < 10; i++) { s = s + rand.nextInt(1000) + " "; } System.out.println(s); }}/<code>

用反编译工具jad执行jad -o -a -s d.java test2.class进行反编译后，发现其内部同样是通过StringBuilder来进行拼接的：

<code>// Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.// Jad home page: http://www.kpdus.com/jad.html// Decompiler options: packimports(3) annotate // Source File Name: test2.javapackage example;import java.io.PrintStream;import java.util.Random;public class test2{ public test2() { // 0 0:aload_0 // 1 1:invokespecial #1 <method> // 2 4:return } public static void main(String args[]) { String s = ""; // 0 0:ldc1 #2 <string> // 1 2:astore_1 Random rand = new Random(); // 2 3:new #3 <class> // 3 6:dup // 4 7:invokespecial #4 <method> // 5 10:astore_2 for(int i = 0; i < 10; i++) //* 6 11:iconst_0 //* 7 12:istore_3 //* 8 13:iload_3 //* 9 14:bipush 10 //* 10 16:icmpge 55 s = (new StringBuilder()).append(s).append(rand.nextInt(1000)).append(" ").toString(); // 11 19:new #5 <class> // 12 22:dup // 13 23:invokespecial #6 <method> // 14 26:aload_1 // 15 27:invokevirtual #7 <method> // 16 30:aload_2 // 17 31:sipush 1000 // 18 34:invokevirtual #8 <method> // 19 37:invokevirtual #9 <method> // 20 40:ldc1 #10 <string> // 21 42:invokevirtual #7 <method> // 22 45:invokevirtual #11 <method> // 23 48:astore_1 // 24 49:iinc 3 1 //* 25 52:goto 13 System.out.println(s); // 26 55:getstatic #12 <field> // 27 58:aload_1 // 28 59:invokevirtual #13 <method> // 29 62:return }}/<method>/<field>/<method>/<method>/<string>/<method>/<method>/<method>/<method>/<class>/<method>/<class>/<string>/<method>/<code>

综上案例分析，发现字符串进行“+”拼接时，内部有以下几种情况：

1.“+”直接拼接的是常量变量，如"ab"+"cd"+"ef"+"123"，内部编译就把几个连接成一个常量字符串处理；

2. “+”拼接的含变量字符串，如案例2："ok" + s + "xyz" + 5，内部编译其实是new 一个StringBuilder来进行来通过append进行拼接；

3.案例3循环过程，实质也是“+”拼接含变量字符串，因此，内部编译时，也会创建StringBuilder来进行拼接。

对比三种情况，发现第三种情况每次做循环，都会新创建一个StringBuilder对象，这会增加系统的内存，反过来就会降低系统性能。

因此，在做字符串拼接时，单线程环境下，可以显性使用StringBuilder来进行拼接，避免每循环一次就new一个StringBuilder对象；在多线程环境下，可以使用线程安全的StringBuffer，但涉及到锁竞争，StringBuffer性能会比StringBuilder差一点。

这样，起到在字符串拼接时的优化效果。

二.如何使用String.intern节省内存？

在回答这个问题之前，可以先对一段代码进行测试：

1.首先在idea设置-XX:+PrintGCDetails -Xmx6G -Xmn3G，用来打印GC日志信息，设置如下图所示：

2.执行以下例子代码：

<code>public class test4 { public static void main(String[] args) { final int MAX=10000000; System.out.println("不用intern："+notIntern(MAX));// System.out.println("使用intern："+intern(MAX)); } private static long notIntern(int MAX){ long start = System.currentTimeMillis(); for (int i = 0; i < MAX; i++) { int j = i % 100; String str = String.valueOf(j); } return System.currentTimeMillis() - start; }/* private static long intern(int MAX){ long start = System.currentTimeMillis(); for (int i = 0; i < MAX; i++) { int j = i % 100; String str = String.valueOf(j).intern(); } return System.currentTimeMillis() - start; }*//<code>

未使用intern的GC日志：

<code>不用intern：354[GC (System.gc()) [PSYoungGen: 377487K->760K(2752512K)] 377487K->768K(2758656K), 0.0009102 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System.gc()) [PSYoungGen: 760K->0K(2752512K)] [ParOldGen: 8K->636K(6144K)] 768K->636K(2758656K), [Metaspace: 3278K->3278K(1056768K)], 0.0051214 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] Heap PSYoungGen total 2752512K, used 23593K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000) eden space 2359296K, 1% used [0x0000000700000000,0x000000070170a548,0x0000000790000000) from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000) to space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000) ParOldGen total 6144K, used 636K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000) object space 6144K, 10% used [0x0000000640000000,0x000000064009f2f8,0x0000000640600000) Metaspace used 3284K, capacity 4500K, committed 4864K, reserved 1056768K class space used 359K, capacity 388K, committed 512K, reserved 1048576K/<code>

根据打印的日志分析：没有使用intern情况下，执行时间为354ms，占用内存为24229k;

使用intern的GC日志：

<code>使用intern：1515[GC (System.gc()) [PSYoungGen: 613417K->1144K(2752512K)] 613417K->1152K(2758656K), 0.0012530 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System.gc()) [PSYoungGen: 1144K->0K(2752512K)] [ParOldGen: 8K->965K(6144K)] 1152K->965K(2758656K), [Metaspace: 3780K->3780K(1056768K)], 0.0079962 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] Heap PSYoungGen total 2752512K, used 15729K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000) eden space 2359296K, 0% used [0x0000000700000000,0x0000000700f5c400,0x0000000790000000) from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000) to space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000) ParOldGen total 6144K, used 965K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000) object space 6144K, 15% used [0x0000000640000000,0x00000006400f1740,0x0000000640600000) Metaspace used 3786K, capacity 4540K, committed 4864K, reserved 1056768K class space used 420K, capacity 428K, committed 512K, reserved 1048576K/<code>

日志分析：没有使用intern情况下，执行时间为1515ms，占用内存为16694k;

综上所述:使用intern情况下，内存相对没有使用intern的情况要小，但在节省内存的同时，增加了时间复杂度。我试过将MAX=10000000再增加一个0的情况下，使用intern将会花费高达11秒的执行时间，可见，在遍历数据过大时，不建议使用intern。

因此，使用intern的前提，一定要考虑到具体的使用场景。

到这里，可以确定，使用String.intern确实可以节省内存。

接下来，分析一下intern在不同JDK版本的区别。

在JDK1.6中，字符串常量池在方法区中，方法区属于永久代。

在JDK1.7中，字符串常量池移到了堆中。

在JDK1.8中，字符串常量池移到了元空间里，与堆相独立。

分别在1.6、1.7、1.8版本执行以下一个例子：

<code>public class test5 { public static void main(String[] args) { String s1=new String("ab"); s.intern(); String s2="ab"; System.out.println(s1==s2); String s3=new String("ab")+new String("cd"); s3.intern(); String s4="abcd"; System.out.println(s4==s3); }}/<code>

1.6版本

执行结果：

fasle false

分析：

执行第一部分时：

1.代码编译时，先在字符串常量池里创建常量“ab"；在调用new时，将在堆中创建一个String对象，字符串常量创建的“ab"存储到堆中，最后堆中的String对象返回一个引用给s1。

2.s.intern()，在字符串常量池里已经存在“ab”,便不再创建存放副本“ab"；

3.s2="ab"，s2指向的是字符串常量池里”ab"，而s1指向的堆中的”ab"，故两者不相等。

该示意图如下：

执行第二部分：

1.两个new出来相加的“abcd”存放在堆中，s3指向堆中的“abcd";

2.执行s3.intern()，在将“abcd"副本的存放到字符串常量池时，发现常量池里没有该”abcd"，因此，成功存放；

3.s4="abcd"指向的是字符串常量池里已有的“abcd"副本，而s3指向的是堆中的"abcd"，副本"abcd"的地址和堆中“abcd"地址不相同，故为false;

1.7版本

false true

执行第一部分：这一部分与jdk1.6基本类似，不同在于，s1.intern()返回的是引用，而不是副本。

执行第二部分：

1.new String("ab")+new String("cd")，先在常量池里生成“ab"和”cd"，再在堆中生成“abcd";

2.执行s3.intern()时，会把“abcd”的对象引用放到字符串常量池里，发现常量池里还没有该引用，故可成功放入。当String s4="abcd"，即把字符串常量池中”abcd“的引用地址赋值给s4，相当于s4指向了堆中”abcd"的地址，故s3==s4为true。

1.8版本

false true

参考网上一些博客，在1.8版本当中，使用intern()时，执行原理如下：

若字符串常量池中，包含了与当前对象相当的字符串，将返回常量池里的字符串；若不存在，则将该字符串存放进常量池里，并返回字符串的引用。

综上所述，可见三种版本当中，使用intern时，若字符串常量池里不存在相应字符串时，存在以下区别：

例如：

String s1=new String("ab"); s.intern();

jdk1.6:若字符串常量池里没有“ab"，则会在常量池里存放一个“ab"副本，该副本地址与堆中的”ab"地址不相等；

jdk1.7:若字符串常量池里没有“ab"，会将“ab”的对象引用放到字符串常量池里，该引用地址与堆中”ab"的地址相同；

jdk1.8:若字符串常量池中包含与当前对象相当的字符串，将返回常量池里的字符串；若不存在，则将该字符串存放进常量池里，并返回字符串的引用。

三.如何使用字符串的分割方法？

在简单进行字符串分割时，可以用indexOf替代split，因为split的性能不够稳定，故针对简单的字符串分割，可优先使用indexOf代替；

一.优化构建的超大字符串

二.如何使用String.intern节省内存？

三.如何使用字符串的分割方法？

相關文章:

5 个刁钻的 String 面试题！

5 个刁钻的 String 面试题！你都遇到过哪些？

Java里的 String，看似简单，但大有学问

头条面试官：String、StringBuffer、StringBuilder有什么区别？

面试刷题5:String StringBuffer StringBuilder区别？

string 与char* char[]区别及转化

如果面试官问 String，就把这篇文章丢给他！

18 Strings for Mac(Xcode文件翻译工具) v2020.1激活版

String.split你不知道的事

每天一道面试题-Java基础-"i"与 new String("i")一样吗

JAVA中，String 是最基本的数据类型吗

注释驱动的 Spring cache 缓存介绍

深入理解java String

Java基础之字符串及——String

JAVA基础&String&StringBuffered&StringBuilder

String、StringBuffer、StringBuilder

java8 stream自定义分组求和并排序

01.03 String、StringBuffer与StringBuilder的区别以及类之间的关系

美团面试官问我一个字符 String.length()是多少我说1面试官说滚

01.02 java8 学习Lambda &lt;第二天&gt; 基本语法

12.13 String 有多长？

C＃初学者教程系列4：C井数据类型示例，int、double、string

spring自带的CollectionUtils工具类，集合操作原来这么简单

11.23 什么是 String 的不可变性？

API常见接口

String 使用不当可能导致内存泄露

String str = ""和String str =new String("")分别创建几个对象

10.23 从 String.getBytes 理解 Java 编码和解码

巧用 Java8 的 Stream 对集合操作飞起来

09.12 Java面试题五、为什么 char 数组比 String 更适合存储密码？

为什么 String hashCode 方法选择数字31作为乘子？

复现一个典型的线上Spring Bean对象的线程安全问题

你们要的string字符串详解！C++逆向学习(一) string

String、StringBuffer与StringBuilder之间区别

聊聊Java String.intern 背后你不知道的知识

String：字符串常量池，彻底搞懂创建几个对象，是否相等的问题

Android中String资源文件的可变参数设定(String.format()的用法）

科普：String hashCode 方法为什么选择数字31作为乘子

Java 11 已发布，String 还能这样玩！

JDK10源码阅读——String

jdk String trim()方法探究

Python 模块 string-常量和模板

String StringBuilder StringBuffer的区别？

Java 中 String 类的操作

「每日一面」String 相关面试题全解

基本的 redis 操作與 Strings Lists Hashes資料型態

《深入理解java虚拟机》String.intern()探究

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

网络工程师职业生涯中，哪两点是最重要的？

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

01.02 java8 学习Lambda <第二天> 基本语法

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪