大家好,今天给大家分享java基础知识之String。
String类的重要性就不必说了,可以说是我们后端开发用的最多的类,所以,很有必要好好来聊聊它。
本文主要内容如下:
我们先来说说,java中八大数据类型,然后在说String。
byte:8位,最大存储数据量是255,存放的数据范围是-128~127之间。
short:16位,最大数据存储量是65536,数据范围是-32768~32767之间。
int:32位,最大数据存储容量是2的32次方减1,数据范围是负的2的31次方到正的2的31次方减1。
long:64位,最大数据存储容量是2的64次方减1,数据范围为负的2的63次方到正的2的63次方减1。
float:32位,数据范围在3.4e-45~1.4e38,直接赋值时必须在数字后加上f或F。
double:64位,数据范围在4.9e-324~1.8e308,赋值时可以加d或D也可以不加。
boolean:只有true和false两个取值。
char:16位,存储Unicode码,用单引号赋值。
除了这八大数据类型以外(八大数据类型也有与之对应的封装类型,我相信你是知道的),Java中还有一种比较特殊的类型:String,字面意义就是字符串。
地址:https://docs.oracle.com/en/java/javase/11/docs/api/java.base/java/lang/String.html
https://docs.oracle.com/en/java/javase/11/docs/api/java.base/java/lang/String.html
看不懂吗?没事,我们可以借用翻译工具,浏览器自带的,更希望的是你能看懂原版英文。
String 存在于咱们安装的JDK
目录下rt.ar
包中,全路径名为:java.lang.String
JDK
目录下rt.ar
包中,全路径名为:java.lang.String
。我们java代码中String用来表示字符串,比如:1 2 |
|
1 2 3 4 5 6 7 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 |
|
我们开发中差不多也就是这么使用了,但是如果你仅仅是使用很牛了,貌似遇到面试照样会挂。所以,学知识,不能停留在使用层面,需要更深层次的学习。
下面我们就来深层次的学习String,希望大家带着一颗平常的心学习,不要害怕什么,灯笼是张纸,捅破不值钱。
备注:JDK版本为1.8+,因为JDK9版本中和旧版本有细微差别。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
|
* is equivalent to: *
1
2
3
* char data[] = {'a', 'b', 'c'};
* String str =
new
String(data);
*
* Here are some more examples of how strings can be used: * String使用案例 * System.out.println("abc"); * String cde = "cde"; * System.out.println("abc" + cde); * String c = "abc".substring(2,3); * String d = cde.substring(1, 2); *
* The class {@code String} includes methods for examining * individual characters of the sequence, for comparing strings, for * searching strings, for extracting substrings, and for creating a * copy of a string with all characters translated to uppercase or to * lowercase. Case mapping is based on the Unicode Standard version * specified by the {@link java.lang.Character Character} class. * 这个String类包含了一些测评单个字符序列的方法,比如字符串比较,查找字符串, * 提取字符串,和拷贝一个字符串的大小写副本。 * 大小写映射的是基于Character类支持的Unicode的字符集标准版本。 *
* The Java language provides special support for the string * concatenation operator ( + ), and for conversion of * other objects to strings. * java语言提供了对字符串的特殊支持,如:可以通过"+"号来进行字符串的拼接操作, * 为其他类提供了与字符串转换的操作 * String concatenation is implemented * through the {@code StringBuilder}(or {@code StringBuffer}) * class and its {@code append} method. * 字符串的+号拼接操作是通过StringBuilder或者StringBuffer类的append()方法 * 来实现的 * String conversions are implemented through the method * {@code toString}, defined by {@code Object} and * inherited by all classes in Java. * 对象与字符串的转换操作是通过所有类的父类Object中定义的toString()方法来实现的 * For additional information on * string concatenation and conversion, see Gosling, Joy, and Steele, * The Java Language Specification. * *
Unless otherwise noted, passing a null argument to a constructor * or method in this class will cause a {@link NullPointerException} to be * thrown. * 除非有特殊说明,否则传一个null给String的构造方法或者put方法,会报空指针异常的 *
A {@code String} represents a string in the UTF-16 format * in which supplementary characters are represented by surrogate * pairs (see the section Unicode * Character Representations in the {@code Character} class for * more information). * 一个String 对象代表了一个UTF-16编码语法组成的字符串 * Index values refer to {@code char} code units, so a supplementary * character uses two positions in a {@code String}. *
The {@code String} class provides methods for dealing with * Unicode code points (i.e., characters), in addition to those for * dealing with Unicode code units (i.e., {@code char} values). * 索引值指向字符码单元,所以一个字符在一个字符串中使用两个位置, * String 类提供了一些方法区处理单个Unicode编码,除了那些处理Unicode代码单元。 * @since JDK1.0 */
以上便是String类注释的整个片段,后面剩下的就是作者、相关类、相关方法以及从JDK哪个版本开始有的。
1 2 3 4 |
|
类图
String类被final修饰,表示String不可以被继承。下面我们来说说String实现三个接口有什么用处:
简单介绍final
修饰类:类不可被继承,也就是说,String类不可被继承了
修饰方法:把方法锁定,以访任何继承类修改它的涵义
修饰遍历:初始化后不可更改
1 2 3 4 5 6 7 |
|
char value[]
被final修饰,说明value[]数组是不可变的。
1 2 3 4 5 6 7 8 9 10 |
|
无参构造方法中是将一个空字符串的value值赋给当前value。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
把original的value赋给当前的value,并把original的hash赋给当前的hash。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
|
使用Arrays类的copyOf方法,新建一个char数组,将original的内容放到新建的char数组中。
然后,把新建的char数组赋给当前的vlaue。
1 2 3 4 5 |
|
因为StringBuffer是线程安全类,所以,这里加了同步锁,保证线程安全。
1 2 3 |
|
StringBuilder是非线程安全的,这里也就没有做线程安全处理,其他内容和前面一样。
注:很多时候我们不会这么去构造,因为StringBuilder跟StringBuffer有toString方法如果不考虑线程安全,优先选择StringBuilder
这里就讲这么多构造方法,其他很复杂,也基本不用,所以,了解这些就够了。如果对其他感兴趣的,可以自行去研究研究。
前面的使用案例中,我们已经对String的大部分方法进行演示一波,这里我们就挑几个相对重要的方法进行深度解析。
hashCode()方法是在Object类中定义的,String对其进行了重写。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
hashCode的一个具体实现,由于java体系中每个对象都可以转换成String,因此他们应该都是通过这个hash来实现的
接着,我们看看equals()方法;
equals()方法也是Object类中定义的,String类对其进行了重写。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
|
补充:==比较
1 2 |
|
substring方法在工作使用的也是相当的多,作用就是截取一段字符串。
1 2 3 4 5 6 7 8 9 10 11 12 |
|
intern()
方法是native
修饰的方法,表示该方法为本地方法。
1 2 3 4 5 6 7 8 |
|
方法注释会有写到,意思就是调用方法时,如果常量池有当前String
的值,就返回这个值,没有就加进去,返回这个值的引用。
案例如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
运行结果
1 2 3 4 |
|
获取字符串长度,实际上是获取字符数组长度 ,源码就非常简单了,没什么好说的。
1 2 3 |
|
判断字符串是否为空,实际上是盼复字符数组长度是否为0
,源码也是非常简单,没什么好说的。
1 2 3 |
|
根据索引参数获取字符 。
1 2 3 4 5 6 7 8 |
|
获取字符串的字节数组,按照系统默认字符编码将字符串解码为字节数组 。
1 2 3 |
|
这个方法写的很巧妙,先从0开始判断字符大小。如果两个对象能比较字符的地方比较完了还相等,就直接返回自身长度减被比较对象长度,如果两个字符串长度相等,则返回的是0,巧妙地判断了三种情况。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
|
起始比较和末尾比较都是比较经常用得到的方法,例如:在判断一个字符串是不是http协议的,或者初步判断一个文件是不是mp3文件,都可以采用这个方法进行比较。
1 2 3 4 5 6 7 8 9 10 11 |
|
concat方法也是经常用的方法之一,它先判断被添加字符串是否为空来决定要不要创建新的对象。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
|
这个方法也有讨巧的地方,例如最开始先找出旧值出现的位置,这样节省了一部分对比的时间。replace(String oldStr,String newStr)方法通过正则表达式来判断。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
trim方法就是将字符串中的空白字符串删掉。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
|
1 2 3 4 5 6 7 8 |
|
split()
方法用于把一个字符串分割成字符串数组,返回一个字符串数组返回的数组中的字串不包括 regex
自身。可选的“limit
”是一个整数,第一个方法中默认是0,允许各位指定要返回的最大数组的元素个数。
常见方法源码分析就这么多了,下面我们再回顾到使用场景中来,尤其是面试中。
在java中比较对象是否相同,通常有两种方法:
==
equals
方法注意==
用于基本数据类型的比较和用于引用类型的比较的区别。
==比较基本数据类型,比较的是值
==比较引用数据类型,比较的是地址值
另外,String
对equals
方法进行了重写,所以比较字符串咱们还是要使用equals
方法来比较。主要是String
的equals
方法里包含了==
的判断(请看前面源码分析部分)。
案例
1 2 3 4 5 6 7 8 |
|
输出
1 2 |
|
看下面这段代码:
1 2 |
|
关于这段代码,创建了几个对象,网上答案有多重,1个,2个还有3个的。下面我们就来聊聊到底是几个?
首先,我们需要明确的是;不管是str1还是str2,他们都是String类型的变量,不是对象,平时,可能我们会叫str2对象,那只是为了便于理解,本质上来说str2、str1都不是对象。
其次,String str="abc";
的时候,字符串“abc”会被存储在字符串常量池中,只有1份,此时的赋值操作等于是创建0个或1个对象。如果常量池中已经存在了“abc”,那么不会再创建对象,直接将引用赋值给str1;如果常量池中没有“abc”,那么创建一个对象,并将引用赋值给str1。String str="abc";
的时候,字符串“abc”会被存储在字符串常量池中,只有1份,此时的赋值操作等于是创建0个或1个对象。如果常量池中已经存在了“abc”,那么不会再创建对象,直接将引用赋值给str1;如果常量池中没有“abc”,那么创建一个对象,并将引用赋值给str1。
那么,通过new String("abc");的形式又是如何呢?
答案是1个或2个。
当JVM遇到上述代码时,会先检索常量池中是否存在“abc”,如果不存在“abc”这个字符串,则会先在常量池中创建这个一个字符串。然后再执行new操作,会在堆内存中创建一个存储“abc”的String对象,对象的引用赋值给str2。此过程创建了2个对象。
当然,如果检索常量池时发现已经存在了对应的字符串,那么只会在堆内创建一个新的String对象,此过程只创建了1个对象。
最后,如果单独问String str=new String("abc");
答案是1个或2个。
当JVM遇到上述代码时,会先检索常量池中是否存在“abc”,如果不存在“abc”这个字符串,则会先在常量池中创建这个一个字符串。然后再执行new操作,会在堆内存中创建一个存储“abc”的String对象,对象的引用赋值给str2。此过程创建了2个对象。当然,如果检索常量池时发现已经存在了对应的字符串,那么只会在堆内创建一个新的String对象,此过程只创建了1个对象。
最后,如果单独问String str=new String("abc");
创建了几个对象,切记:常量池中是否存在"abc",存在,创建一个对象;不存在创建两个对象。
String 和 StringBuilder、StringBuffer 的区别
线程安全性String 中的对象是不可变的,也就可以理解为常量,线程安全。AbstractStringBuilder 是 StringBuilder 与 StringBuffer 的公共父类,定义了一些字符串的基本操作,如 expandCapacity、append、insert、indexOf 等公共方法。StringBuffer 对方法加了同步锁或者对调用的方法加了同步锁,所以是线程安全的。StringBuilder 并没有对方法进行加同步锁,所以是非线程安全的。
🎜🎜性能🎜🎜🎜每次对 String 类型进行改变的时候,都会生成一个新的 String 对象,然后将 指针指向新的 String 对象。StringBuffer 每次都会对 StringBuffer 对象本身进行操作,而不是生成新的对象并改变对象引用。相同情况下使用 StringBuilder 相比使用 StringBuffer 仅能获得 10%~15% 左右的性能提升,但却要冒多线程不安全的风险。🎜🎜对于三者使用的总结:🎜String
StringBuilder
StringBuffer
String 常见的创建方式有两种,new String() 的方式和直接赋值的方式,直接赋值的方式会先去字符串常量池中查找是否已经有此值,如果有则把引用地址直接指向此值,否则会先在常量池中创建,然后再把引用指向此值;而 new String() 的方式一定会先在堆上创建一个字符串对象,然后再去常量池中查询此字符串的值是否已经存在,如果不存在会先在常量池中创建此字符串,然后把引用的值指向此字符串。
JVM中的常量池
字面量—文本字符串,也就是我们举例中的 public String s = " abc ";
中的 "abc"。
用 final 修饰的成员变量,包括静态变量、实例变量和局部变量。
请看下面这段代码:
1 2 3 4 5 |
|
它们在 JVM 存储的位置,如下图所示:
注意:JDK 1.7 之后把永生代换成的元空间,把字符串常量池从方法区移到了 Java 堆上。
除此之外编译器还会对 String 字符串做一些优化,例如以下代码:
1 2 3 |
|
虽然 s1 拼接了多个字符串,但对比的结果却是 true,我们使用反编译工具,看到的结果如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
|
从编译代码 #2 可以看出,代码 "Ja"+"va" 被直接编译成了 "Java" ,因此 s1==s2 的结果才是 true,这就是编译器对字符串优化的结果。
下面先看看length方法源码:
1 2 3 4 |
|
length()方法返回的是int类型,那可以得知String类型的长度肯定不能超过Integer.MAX_VALUE
的。
答:首先字符串的内容是由一个字符数组 char[] 来存储的,由于数组的长度及索引是整数,且String类中返回字符串长度的方法length() 的返回值也是int ,所以通过查看java源码中的类Integer我们可以看到Integer的最大范围是2^31 -1,由于数组是从0开始的,所以**数组的最大长度可以使【0~2^31】**通过计算是大概4GB。
但是通过翻阅java虚拟机手册对class文件格式的定义以及常量池中对String类型的结构体定义我们可以知道对于索引定义了u2,就是无符号占2个字节,2个字节可以表示的最大范围是2^16 -1 = 65535。
但是由于JVM需要1个字节表示结束指令,所以这个范围就为65534了。超出这个范围在编译时期是会报错的,但是运行时拼接或者赋值的话范围是在整形的最大范围。
从JDK7
开始的话,我们就可以在switch条件表达式中使用字符串了,也就是说7之前的版本是不可以的。
1 2 3 4 5 6 7 8 |
|
在JDK7
之前的版本,调用这个方法的时候,会去常量池中查看是否已经存在这个常量了,如果已经存在,那么直接返回这个常量在常量池中的地址值,如果不存在,则在常量池中创建一个,并返回其地址值。
但是在JDK7
以及之后的版本中,常量池从perm区搬到了heap区。intern检测到这个常量在常量池中不存在的时候,不会直接在常量池中创建该对象了,而是将堆中的这个对象的引用直接存到常量池中,减少内存开销。
下面的案例
1 2 3 4 5 6 7 8 9 10 |
|
以上是2w字 详解 String,yyds的详细内容。更多信息请关注PHP中文网其他相关文章!