溫故知新（二）深入認識Java中的字串-Java基礎-PHP中文網

溫故知新（二）深入認識Java中的字串

相關學習推薦：java基礎教學

#上篇文章我們深入分析了String的記憶體和它的一些特性。本篇文章我們深入的來分析一下與String相關的另外兩個類，它們分別是StringBuilder和StringBuffer。這兩個類別與String有什麼關係呢？首先我們看下邊這張類別圖：

從圖中可以看出StringBuilder和StringBuffer都繼承了AbstractStringBuilder，而AbstractStringBuilder與String實現了共同的介面CharSequence。

我們知道，字串是由一系列字元組成的，String的內部就是基於char數組（jdk9之後基於byte數組）實現的，而數組通常是一塊連續的記憶體區域，在數組初始化的時候就需要指定數組的大小。上一篇文章中我們已經知道String是不可變的，因為它內部的陣列被聲明為了final，同時，String的字元拼接、插入、刪除等操作均是透過實例化新的物件實現的。而今天要認識的StringBuilder和StringBuffer與String相比就具有了動態性。接下來就讓我們一起來認識這兩個類別。

一、StringBuilder

在StringBuilder的父類別AbstractStringBuilder 中可以看到如下程式碼：

abstract class AbstractStringBuilder implements Appendable, CharSequence {    /**
     * The value is used for character storage.
     */
    char[] value;    /**
     * The count is the number of characters used.
     */
    int count;
}复制代码

登入後複製

StringBuilder與String一樣都是基於char陣列實作的，不同的是StringBuilder沒有final修飾，這意味著StringBuilder是可以被動態改變的。接下來看下StringBuilder無參構造方法，程式碼如下：

 /**
     * Constructs a string builder with no characters in it and an
     * initial capacity of 16 characters.
     */
    public StringBuilder() {        super(16);
    }复制代码

登入後複製

在這個方法中呼叫了父類別的建構方法，到AbstractStringBuilder 中看到其建構方法如下：

    /**
     * Creates an AbstractStringBuilder of the specified capacity.
     */
    AbstractStringBuilder(int capacity) {
        value = new char[capacity];
    }复制代码

登入後複製

#AbstractStringBuilder的構造方法內部初始化了一個容量為capacity的陣列。也就是說StringBuilder預設初始化了一個容量為16的char[]陣列。 StringBuilder中除了無參構造外還提供了多個建構方法，原始碼如下：

 /**
     * Constructs a string builder with no characters in it and an
     * initial capacity specified by the {@code capacity} argument.
     *
     * @param      capacity  the initial capacity.
     * @throws     NegativeArraySizeException  if the {@code capacity}
     *               argument is less than {@code 0}.
     */
    public StringBuilder(int capacity) {        super(capacity);
    }    /**
     * Constructs a string builder initialized to the contents of the
     * specified string. The initial capacity of the string builder is
     * {@code 16} plus the length of the string argument.
     *
     * @param   str   the initial contents of the buffer.
     */
    public StringBuilder(String str) {        super(str.length() + 16);
        append(str);
    }    /**
     * Constructs a string builder that contains the same characters
     * as the specified {@code CharSequence}. The initial capacity of
     * the string builder is {@code 16} plus the length of the
     * {@code CharSequence} argument.
     *
     * @param      seq   the sequence to copy.
     */
    public StringBuilder(CharSequence seq) {        this(seq.length() + 16);
        append(seq);
    }复制代码

登入後複製

這段程式碼的第一個方法初始化一個指定容量大小的StringBuilder。另外兩個建構方法分別可以傳入String和CharSequence來初始化StringBuilder，這兩個建構方法的容量都會在傳入字串長度的基礎上在加上16。

1.StringBuilder的append操作與擴容

上篇文章已經知道透過StringBuilder的append方法可以進行高效率的字串拼接，append方法是如何實現的呢？這裡以append（String）為例，可以看到StringBuilder的append呼叫了父類別的append方法，其實不只append，StringBuilder類別中操作字串的方法幾乎都是透過父類別來實現的。 append方法原始碼如下：

    // StringBuilder
    @Override
    public StringBuilder append(String str) {        super.append(str);        return this;
    }    
  // AbstractStringBuilder
  public AbstractStringBuilder append(String str) {        if (str == null)            return appendNull();        int len = str.length();
        ensureCapacityInternal(count + len);
        str.getChars(0, len, value, count);
        count += len;        return this;
    }复制代码

登入後複製

在append方法的第一行首先進行了null檢查，等於null的時候呼叫了appendNull方法。其原始碼如下：

private AbstractStringBuilder appendNull() {        int c = count;
        ensureCapacityInternal(c + 4);        final char[] value = this.value;
        value[c++] = &#39;n&#39;;
        value[c++] = &#39;u&#39;;
        value[c++] = &#39;l&#39;;
        value[c++] = &#39;l&#39;;
        count = c;        return this;
    }复制代码

登入後複製

appendNull方法中首先呼叫了ensureCapacityInternal來確保字串陣列容量充值，關於ensureCapacityInternal這個方法下邊再詳細分析。接下來可以看到把"null"的字元加到了char[]數組value中。

上文我們提到，StringBuilder內部陣列的預設容量是16，因此，在進行字串拼接的時候需要先確保char[]陣列有足夠的容量。因此，在appendNull方法以及append方法中都調用了ensureCapacityInternal方法來檢查char[]數組是否有足夠的容量，如果容量不足則會對數組進行擴容，ensureCapacityInternal源碼如下：

private void ensureCapacityInternal(int minimumCapacity) {        // overflow-conscious code
        if (minimumCapacity - value.length > 0)
            expandCapacity(minimumCapacity);
    }复制代码

登入後複製

這裡判讀如果拼接後的字串長度大於字串陣列的長度則會呼叫expandCapacity進行擴容。

void expandCapacity(int minimumCapacity) {        int newCapacity = value.length * 2 + 2;        if (newCapacity - minimumCapacity < 0)
            newCapacity = minimumCapacity;        if (newCapacity < 0) {            if (minimumCapacity < 0) // overflow
                throw new OutOfMemoryError();
            newCapacity = Integer.MAX_VALUE;
        }
        value = Arrays.copyOf(value, newCapacity);
    }复制代码

登入後複製

expandCapacity的邏輯也很簡單，先透過原數組的長度乘2並加2後計算得到擴容後的數組長度。接下來判斷了newCapacity如果小於minimumCapacity，則將minimumCapacity值賦值給了newCapacity。這裡因為呼叫expandCapacity方法的不只一個地方，所以加這句程式碼確保安全。

而接下來的一句程式碼就很有趣了，newCapacity 和minimumCapacity 還有可能小於0嗎？當minimumCapacity小於0的時候竟然還拋出了一個OutOfMemoryError異常。其實，這裡小於0是因為越界了。我們知道電腦中儲存的都是二進制，乘2相當於向左移了一位。以byte為例，一個byte有8bit,在有符號數中最左邊的一個bit位是符號位，正數的符號位為0，負數為1。那麼一個byte可以表示的大小範圍為[-128~127]，而如果一個數字大於127時則會出現越界，即最左邊的符號位會被左邊第二位的1頂替，就出現了負數的情況。當然，並不是byte而是int,但是原理是一樣的。

另外在这个方法的最后一句通过Arrays.copyOf进行了一个数组拷贝，其实Arrays.copyOf在上篇文章中就有见到过，在这里不妨来分析一下这个方法，看源码：

 public static char[] copyOf(char[] original, int newLength) {        char[] copy = new char[newLength];
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));        return copy;
    }复制代码

登入後複製

咦？copyOf方法中竟然也去实例化了一个对象！！那不会影响性能吗？莫慌，看一下这里仅仅是实例化了一个newLength长度的空数组，对于数组的初始化其实仅仅是指针的移动而已，浪费的性能可谓微乎其微。接着这里通过System.arraycopy的native方法将原数组复制到了新的数组中。

2.StringBuilder的subString()方法toString()方法

StringBuilder中其实没有subString方法，subString的实现是在StringBuilder的父类AbstractStringBuilder中的。它的代码非常简单，源码如下：

public String substring(int start, int end) {        if (start < 0)            throw new StringIndexOutOfBoundsException(start);        if (end > count)            throw new StringIndexOutOfBoundsException(end);        if (start > end)            throw new StringIndexOutOfBoundsException(end - start);        return new String(value, start, end - start);
    }复制代码

登入後複製

在进行了合法判断之后，substring直接实例化了一个String对象并返回。这里和String的subString实现其实并没有多大差别。而StringBuilder的toString方法的实现其实更简单，源码如下：

 @Override
    public String toString() {        // Create a copy, don&#39;t share the array
        return new String(value, 0, count);
    }复制代码

登入後複製

这里直接实例化了一个String对象并将StringBuilder中的value传入，我们来看下String(value, 0, count)这个构造方法：

    public String(char value[], int offset, int count) {        if (offset < 0) {            throw new StringIndexOutOfBoundsException(offset);
        }        if (count < 0) {            throw new StringIndexOutOfBoundsException(count);
        }        // Note: offset or count might be near -1>>>1.
        if (offset > value.length - count) {            throw new StringIndexOutOfBoundsException(offset + count);
        }        this.value = Arrays.copyOfRange(value, offset, offset+count);
    }复制代码

登入後複製

可以看到，在String的这个构造方法中又通过Arrays.copyOfRange方法进行了数组拷贝，Arrays.copyOfRange的源码如下：

   public static char[] copyOfRange(char[] original, int from, int to) {        int newLength = to - from;        if (newLength < 0)            throw new IllegalArgumentException(from + " > " + to);        char[] copy = new char[newLength];
        System.arraycopy(original, from, copy, 0,
                         Math.min(original.length - from, newLength));        return copy;
    }复制代码

登入後複製

Arrays.copyOfRange与Arrays.copyOf类似，内部都是重新实例化了一个char[]数组，所以String构造方法中的this.value与传入进来的value不是同一个对象。意味着StringBuilder在每次调用toString的时候生成的String对象内部的char[]数组并不是同一个！这里立一个Falg！

3.StringBuilder的其它方法

StringBuilder除了提供了append方法、subString方法以及toString方法外还提供了还提供了插入（insert）、删除（delete、deleteCharAt）、替换（replace）、查找（indexOf）以及反转（reverse）等一些列的字符串操作的方法。但由于实现都非常简单，这里就不再赘述了。

二、StringBuffer

在第一节已经知道，StringBuilder的方法几乎都是在它的父类AbstractStringBuilder中实现的。而StringBuffer同样继承了AbstractStringBuilder，这就意味着StringBuffer的功能其实跟StringBuilder并无太大差别。我们通过StringBuffer几个方法来看

     /**
     * A cache of the last value returned by toString. Cleared
     * whenever the StringBuffer is modified.
     */
    private transient char[] toStringCache;    @Override
    public synchronized StringBuffer append(String str) {
        toStringCache = null;        super.append(str);        return this;
    }    /**
     * @throws StringIndexOutOfBoundsException {@inheritDoc}
     * @since      1.2
     */
    @Override
    public synchronized StringBuffer delete(int start, int end) {
        toStringCache = null;        super.delete(start, end);        return this;
    }  /**
     * @throws StringIndexOutOfBoundsException {@inheritDoc}
     * @since      1.2
     */
    @Override
    public synchronized StringBuffer insert(int index, char[] str, int offset,                                            int len)
    {
        toStringCache = null;        super.insert(index, str, offset, len);        return this;
    }@Override
    public synchronized String substring(int start) {        return substring(start, count);
    }    
// ...复制代码

登入後複製

可以看到在StringBuffer的方法上都加上了synchronized关键字,也就是说StringBuffer的所有操作都是线程安全的。所以，在多线程操作字符串的情况下应该首选StringBuffer。另外，我们注意到在StringBuffer的方法中比StringBuilder多了一个toStringCache的成员变量，从源码中看到toStringCache是一个char[]数组。它的注释是这样描述的：

toString返回的最后一个值的缓存，当StringBuffer被修改的时候该值都会被清除。

我们再观察一下StringBuffer中的方法，发现只要是操作过操作过StringBuffer中char[]数组的方法，toStringCache都被置空了！而没有操作过字符数组的方法则没有对其做置空操作。另外，注释中还提到了 toString方法，那我们不妨来看一看StringBuffer中的 toString，源码如下：

   @Override
    public synchronized String toString() {        if (toStringCache == null) {
            toStringCache = Arrays.copyOfRange(value, 0, count);
        }        return new String(toStringCache, true);
    }复制代码

登入後複製

这个方法中首先判断当toStringCache 为null时会通过 Arrays.copyOfRange方法对其进行赋值，Arrays.copyOfRange方法上边已经分析过了，他会重新实例化一个char[]数组，并将原数组赋值到新数组中。这样做有什么影响呢？细细思考一下不难发现在不修改StringBuffer的前提下，多次调用StringBuffer的toString方法，生成的String对象都共用了同一个字符数组--toStringCache。这里是StringBuffer和StringBuilder的一点区别。至于StringBuffer中为什么这么做其实并没有很明确的原因，可以参考StackOverRun 《Why StringBuffer has a toStringCache while StringBuilder not?》中的一个回答:

1.因为StringBuffer已经保证了线程安全，所以更容易实现缓存（StringBuilder线程不安全的情况下需要不断同步toStringCache） 2.可能是历史原因

三、总结

本篇文章到此就结束了。《深入理解Java中的字符串》通过两篇文章深入的分析了String、StringBuilder与StringBuffer三个字符串相关类。这块内容其实非常简单，只要花一点时间去读一下源码就很容易理解。当然，如果你没看过此部分源码相信这篇文章能够帮助到你。不管怎样，相信大家通过阅读本文还是能有一些收获。解了这些知识后可以帮助我们在开发中对字符串的选用做出更好的选择。同时，这块内容也是面试常客，相信大家读完本文去应对面试官的问题也会绰绰有余。