透過源碼學優化：String字符串性能優化的方案，你知道幾種？

2020-02-05 15:02:09 老男孩的成長之路

String字符串是系統裡最常用的類型之一，在系統中佔據了很大的內存，因此，高效地使用字符串，對系統的性能有較好的提升。

針對字符串的優化，我在工作與學習過程總結了以下三種方案作分享：

一.優化構建的超大字符串

驗證環境：jdk1.8

反編譯工具：jad

2.驗證

先執行一段例子1代碼：

<code>public class test3 {    public static void main(String[] args) {        String str="ab"+"cd"+"ef"+"123";    }}/<code>

執行完成後，用反編譯工具jad進行反編譯：jad -o -a -s d.java test.class

反編譯後的代碼：

<code>// Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.// Jad home page: http://www.kpdus.com/jad.html// Decompiler options: packimports(3) annotate // Source File Name:   test.javapackage example;public class test{    public test()    {    //    0    0:aload_0             //    1    1:invokespecial   #1   <method>    //    2    4:return              }    public static void main(String args[])    {        String str = "abcdef123";    //    0    0:ldc1            #2   <string>    //    1    2:astore_1            //    2    3:return              }}/<string>/<method>/<code>

案例2：

<code>public class test1 {    public static void main(String[] args)    {        String s = "abc";        String ss = "ok" + s + "xyz" + 5;        System.out.println(ss);    }}/<code>

用反編譯工具jad執行jad -o -a -s d.java test1.class進行反編譯後：

<code>// Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.// Jad home page: http://www.kpdus.com/jad.html// Decompiler options: packimports(3) annotate // Source File Name:   test1.javapackage example;import java.io.PrintStream;public class test1{    public test1()    {    //    0    0:aload_0             //    1    1:invokespecial   #1   <method>    //    2    4:return              }    public static void main(String args[])    {        String s = "abc";    //    0    0:ldc1            #2   <string>    //    1    2:astore_1                String ss = (new StringBuilder()).append("ok").append(s).append("xyz").append(5).toString();    //    2    3:new             #3   <class>    //    3    6:dup                 //    4    7:invokespecial   #4   <method>    //    5   10:ldc1            #5   <string>    //    6   12:invokevirtual   #6   <method>    //    7   15:aload_1             //    8   16:invokevirtual   #6   <method>    //    9   19:ldc1            #7   <string>    //   10   21:invokevirtual   #6   <method>    //   11   24:iconst_5            //   12   25:invokevirtual   #8   <method>    //   13   28:invokevirtual   #9   <method>    //   14   31:astore_2                System.out.println(ss);    //   15   32:getstatic       #10  <field>    //   16   35:aload_2             //   17   36:invokevirtual   #11  <method>    //   18   39:return              }}/<method>/<field>/<method>/<method>/<method>/<string>/<method>/<method>/<string>/<method>/<class>/<string>/<method>/<code>

根據反編譯結果，可以看到內部其實是通過StringBuilder進行字符串拼接的。

再來執行例3的代碼：

<code>public class test2 {    public static void main(String[] args) {        String s = "";        Random rand = new Random();        for (int i = 0; i < 10; i++) {            s = s + rand.nextInt(1000) + " ";        }        System.out.println(s);    }}/<code>

用反編譯工具jad執行jad -o -a -s d.java test2.class進行反編譯後，發現其內部同樣是通過StringBuilder來進行拼接的：

<code>// Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.// Jad home page: http://www.kpdus.com/jad.html// Decompiler options: packimports(3) annotate // Source File Name:   test2.javapackage example;import java.io.PrintStream;import java.util.Random;public class test2{    public test2()    {    //    0    0:aload_0             //    1    1:invokespecial   #1   <method>    //    2    4:return              }    public static void main(String args[])    {        String s = "";    //    0    0:ldc1            #2   <string>    //    1    2:astore_1                Random rand = new Random();    //    2    3:new             #3   <class>    //    3    6:dup                 //    4    7:invokespecial   #4   <method>    //    5   10:astore_2                for(int i = 0; i < 10; i++)    //*   6   11:iconst_0            //*   7   12:istore_3            //*   8   13:iload_3             //*   9   14:bipush          10    //*  10   16:icmpge          55            s = (new StringBuilder()).append(s).append(rand.nextInt(1000)).append(" ").toString();    //   11   19:new             #5   <class>    //   12   22:dup                 //   13   23:invokespecial   #6   <method>    //   14   26:aload_1             //   15   27:invokevirtual   #7   <method>    //   16   30:aload_2             //   17   31:sipush          1000    //   18   34:invokevirtual   #8   <method>    //   19   37:invokevirtual   #9   <method>    //   20   40:ldc1            #10  <string>    //   21   42:invokevirtual   #7   <method>    //   22   45:invokevirtual   #11  <method>    //   23   48:astore_1            //   24   49:iinc            3  1    //*  25   52:goto            13        System.out.println(s);    //   26   55:getstatic       #12  <field>    //   27   58:aload_1             //   28   59:invokevirtual   #13  <method>    //   29   62:return              }}/<method>/<field>/<method>/<method>/<string>/<method>/<method>/<method>/<method>/<class>/<method>/<class>/<string>/<method>/<code>

綜上案例分析，發現字符串進行“+”拼接時，內部有以下幾種情況：

1.“+”直接拼接的是常量變量，如"ab"+"cd"+"ef"+"123"，內部編譯就把幾個連接成一個常量字符串處理；

2. “+”拼接的含變量字符串，如案例2："ok" + s + "xyz" + 5，內部編譯其實是new 一個StringBuilder來進行來通過append進行拼接；

3.案例3循環過程，實質也是“+”拼接含變量字符串，因此，內部編譯時，也會創建StringBuilder來進行拼接。

對比三種情況，發現第三種情況每次做循環，都會新創建一個StringBuilder對象，這會增加系統的內存，反過來就會降低系統性能。

因此，在做字符串拼接時，單線程環境下，可以顯性使用StringBuilder來進行拼接，避免每循環一次就new一個StringBuilder對象；在多線程環境下，可以使用線程安全的StringBuffer，但涉及到鎖競爭，StringBuffer性能會比StringBuilder差一點。

這樣，起到在字符串拼接時的優化效果。

二.如何使用String.intern節省內存？

在回答這個問題之前，可以先對一段代碼進行測試：

1.首先在idea設置-XX:+PrintGCDetails -Xmx6G -Xmn3G，用來打印GC日誌信息，設置如下圖所示：

2.執行以下例子代碼：

<code>public class test4 {    public static void main(String[] args) {        final int MAX=10000000;        System.out.println("不用intern："+notIntern(MAX));//      System.out.println("使用intern："+intern(MAX));    }    private static long notIntern(int MAX){        long start = System.currentTimeMillis();        for (int i = 0; i < MAX; i++) {            int j = i % 100;            String str = String.valueOf(j);        }        return System.currentTimeMillis() - start;    }/*    private static long intern(int MAX){        long start = System.currentTimeMillis();        for (int i = 0; i < MAX; i++) {            int j = i % 100;            String str = String.valueOf(j).intern();        }        return System.currentTimeMillis() - start;    }*//<code>

未使用intern的GC日誌：

<code>不用intern：354[GC (System.gc()) [PSYoungGen: 377487K->760K(2752512K)] 377487K->768K(2758656K), 0.0009102 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System.gc()) [PSYoungGen: 760K->0K(2752512K)] [ParOldGen: 8K->636K(6144K)] 768K->636K(2758656K), [Metaspace: 3278K->3278K(1056768K)], 0.0051214 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] Heap PSYoungGen      total 2752512K, used 23593K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000)  eden space 2359296K, 1% used [0x0000000700000000,0x000000070170a548,0x0000000790000000)  from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000)  to   space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000) ParOldGen       total 6144K, used 636K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000)  object space 6144K, 10% used [0x0000000640000000,0x000000064009f2f8,0x0000000640600000) Metaspace       used 3284K, capacity 4500K, committed 4864K, reserved 1056768K  class space    used 359K, capacity 388K, committed 512K, reserved 1048576K/<code>

根據打印的日誌分析：沒有使用intern情況下，執行時間為354ms，佔用內存為24229k;

使用intern的GC日誌：

<code>使用intern：1515[GC (System.gc()) [PSYoungGen: 613417K->1144K(2752512K)] 613417K->1152K(2758656K), 0.0012530 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System.gc()) [PSYoungGen: 1144K->0K(2752512K)] [ParOldGen: 8K->965K(6144K)] 1152K->965K(2758656K), [Metaspace: 3780K->3780K(1056768K)], 0.0079962 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] Heap PSYoungGen      total 2752512K, used 15729K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000)  eden space 2359296K, 0% used [0x0000000700000000,0x0000000700f5c400,0x0000000790000000)  from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000)  to   space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000) ParOldGen       total 6144K, used 965K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000)  object space 6144K, 15% used [0x0000000640000000,0x00000006400f1740,0x0000000640600000) Metaspace       used 3786K, capacity 4540K, committed 4864K, reserved 1056768K  class space    used 420K, capacity 428K, committed 512K, reserved 1048576K/<code>

日誌分析：沒有使用intern情況下，執行時間為1515ms，佔用內存為16694k;

綜上所述:使用intern情況下，內存相對沒有使用intern的情況要小，但在節省內存的同時，增加了時間複雜度。我試過將MAX=10000000再增加一個0的情況下，使用intern將會花費高達11秒的執行時間，可見，在遍歷數據過大時，不建議使用intern。

因此，使用intern的前提，一定要考慮到具體的使用場景。

到這裡，可以確定，使用String.intern確實可以節省內存。

接下來，分析一下intern在不同JDK版本的區別。

在JDK1.6中，字符串常量池在方法區中，方法區屬於永久代。

在JDK1.7中，字符串常量池移到了堆中。

在JDK1.8中，字符串常量池移到了元空間裡，與堆相獨立。

分別在1.6、1.7、1.8版本執行以下一個例子：

<code>public class test5 {    public static void main(String[] args) {                String s1=new String("ab");        s.intern();        String s2="ab";        System.out.println(s1==s2);        String s3=new String("ab")+new String("cd");        s3.intern();        String s4="abcd";        System.out.println(s4==s3);    }}/<code>

1.6版本

執行結果：

fasle false

分析：

執行第一部分時：

1.代碼編譯時，先在字符串常量池裡創建常量“ab"；在調用new時，將在堆中創建一個String對象，字符串常量創建的“ab"存儲到堆中，最後堆中的String對象返回一個引用給s1。

2.s.intern()，在字符串常量池裡已經存在“ab”,便不再創建存放副本“ab"；

3.s2="ab"，s2指向的是字符串常量池裡”ab"，而s1指向的堆中的”ab"，故兩者不相等。

該示意圖如下：

執行第二部分：

1.兩個new出來相加的“abcd”存放在堆中，s3指向堆中的“abcd";

2.執行s3.intern()，在將“abcd"副本的存放到字符串常量池時，發現常量池裡沒有該”abcd"，因此，成功存放；

3.s4="abcd"指向的是字符串常量池裡已有的“abcd"副本，而s3指向的是堆中的"abcd"，副本"abcd"的地址和堆中“abcd"地址不相同，故為false;

1.7版本

false true

執行第一部分：這一部分與jdk1.6基本類似，不同在於，s1.intern()返回的是引用，而不是副本。

執行第二部分：

1.new String("ab")+new String("cd")，先在常量池裡生成“ab"和”cd"，再在堆中生成“abcd";

2.執行s3.intern()時，會把“abcd”的對象引用放到字符串常量池裡，發現常量池裡還沒有該引用，故可成功放入。當String s4="abcd"，即把字符串常量池中”abcd“的引用地址賦值給s4，相當於s4指向了堆中”abcd"的地址，故s3==s4為true。

1.8版本

false true

參考網上一些博客，在1.8版本當中，使用intern()時，執行原理如下：

若字符串常量池中，包含了與當前對象相當的字符串，將返回常量池裡的字符串；若不存在，則將該字符串存放進常量池裡，並返回字符串的引用。

綜上所述，可見三種版本當中，使用intern時，若字符串常量池裡不存在相應字符串時，存在以下區別：

例如：

String s1=new String("ab"); s.intern();

jdk1.6:若字符串常量池裡沒有“ab"，則會在常量池裡存放一個“ab"副本，該副本地址與堆中的”ab"地址不相等；

jdk1.7:若字符串常量池裡沒有“ab"，會將“ab”的對象引用放到字符串常量池裡，該引用地址與堆中”ab"的地址相同；

jdk1.8:若字符串常量池中包含與當前對象相當的字符串，將返回常量池裡的字符串；若不存在，則將該字符串存放進常量池裡，並返回字符串的引用。

三.如何使用字符串的分割方法？

在簡單進行字符串分割時，可以用indexOf替代split，因為split的性能不夠穩定，故針對簡單的字符串分割，可優先使用indexOf代替；

分享到:

閱讀更多 老男孩的成長之路 的文章

關鍵字: ab public 源碼

5 個刁鑽的 String 面試題！

5 個刁鑽的 String 面試題！你都遇到過哪些？

Java裡的 String，看似簡單，但大有學問

頭條面試官：String、StringBuffer、StringBuilder有什麼區別？

面試刷題5:String StringBuffer StringBuilder區別？

string 與char* char[]區別及轉化

如果面試官問 String，就把這篇文章丟給他！

18 Strings for Mac(Xcode文件翻譯工具) v2020.1激活版

String.split你不知道的事

每天一道面試題-Java基礎-"i"與 new String("i")一樣嗎

JAVA中，String 是最基本的數據類型嗎

註釋驅動的 Spring cache 緩存介紹

深入理解java String

Java基礎之字符串及——String

JAVA基礎&String&StringBuffered&StringBuilder

String、StringBuffer、StringBuilder

java8 stream自定義分組求和並排序

01.03 String、StringBuffer與StringBuilder的區別以及類之間的關係

美團面試官問我一個字符 String.length()是多少我說1面試官說滾

01.02 java8 學習Lambda <第二天> 基本語法

12.13 String 有多長？

C＃初學者教程系列4：C井數據類型示例，int、double、string

spring自帶的CollectionUtils工具類，集合操作原來這麼簡單

11.23 什麼是 String 的不可變性？

API常見接口

String 使用不當可能導致內存洩露

String str = ""和String str =new String("")分別創建幾個對象

10.23 從 String.getBytes 理解 Java 編碼和解碼

巧用 Java8 的 Stream 對集合操作飛起來

09.12 Java面試題五、為什麼 char 數組比 String 更適合存儲密碼？

為什麼 String hashCode 方法選擇數字31作為乘子？

復現一個典型的線上Spring Bean對象的線程安全問題

你們要的string字符串詳解！C++逆向學習(一) string

String、StringBuffer與StringBuilder之間區別

聊聊Java String.intern 背後你不知道的知識

String：字符串常量池，徹底搞懂創建幾個對象，是否相等的問題

Android中String資源文件的可變參數設定(String.format()的用法）

科普：String hashCode 方法為什麼選擇數字31作為乘子

Java 11 已發佈，String 還能這樣玩！

JDK10源碼閱讀——String

jdk String trim()方法探究

Python 模塊 string-常量和模板

String StringBuilder StringBuffer的區別？

Java 中 String 類的操作

「每日一面」String 相關面試題全解

基本的 redis 操作與 Strings Lists Hashes資料型態

《深入理解java虛擬機》String.intern()探究

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"