Java字符串"学java"占多少内存空间

简介:

51CTO的自测题《验证你Java掌握程度的自测题(一)》中,最后一道题是关于Java字符串所占用的内存空间的,原题如下图:

\"学java\"占多少字节

 出题者给的答案是A. 6个字节。我认为不对。

String作为一个对象,绝不是仅仅包含字符集合这么简单,它一定还需要有用于对象的内存开销,经查,有人根据JVM的内存结构给出了一个String所占用的最少字节数的计算公式 


 
 
  1. Minimum String memory usage (bytes) = 8 * (int) ((((chars number) * 2) + 45) / 8)

且不说对象的额外开销,就"学java"这几个字符来说,占多少字节呢?6个字节——也不对!

Java中字符是按16位的Unicode来保存的,官方《The Java Tutorial》一书中“ Primitive Data Types”一章提到了这一点:

* char: The char data type is a single 16-bit Unicode character. It has a minimum value of '\u0000' (or 0) and a maximum value of '\uffff' (or 65,535 inclusive).

那么"学java"这5个字符就应该是5*16bit=10bytes,即占用10字节内存空间。

那么出题者的答案6字节是怎么来的呢?试试下面这段代码:


 
 
  1. public class Test {  
  2.     public static final void main(String[] args) {  
  3.         System.out.println("学java".getBytes().length);  
  4.     }  
  5. }  

是的,我相信简体中文Windows用户运行这段代码都会得到6这个答案。为什么"学java".getBytes()会得到6个字节呢?不妨来看看getBytes()的文档是怎么说的

Encodes this String into a sequence of bytes using the platform's default charset, storing the result into a new byte array.

也就是说,getBytes()会按当前系统默认的字符集来对字符串进行编码。简体中文Windows的默认字符集,是GBK,GBK中汉字是2个字节,而ASCII占1个字节,所以"学java"是6个字节。

如果你不清楚当前平台/系统的默认字符集,可以用这条语句来看看:


 
 
  1. System.out.println(java.nio.charset.Charset.defaultCharset().toString()); 

 


本文转自边城__ 51CTO博客,原文链接:http://blog.51cto.com/jamesfancy/665745,如需转载请自行联系原作者

相关文章
|
6月前
|
安全 Java 应用服务中间件
Spring Boot + Java 21:内存减少 60%,启动速度提高 30% — 零代码
通过调整三个JVM和Spring Boot配置开关,无需重写代码即可显著优化Java应用性能:内存减少60%,启动速度提升30%。适用于所有在JVM上运行API的生产团队,低成本实现高效能。
692 3
|
6月前
|
SQL JSON Java
告别字符串拼接:用Java文本块优雅处理多行字符串
告别字符串拼接:用Java文本块优雅处理多行字符串
494 108
|
7月前
|
存储 缓存 Java
Java数组全解析:一维、多维与内存模型
本文深入解析Java数组的内存布局与操作技巧,涵盖一维及多维数组的声明、初始化、内存模型,以及数组常见陷阱和性能优化。通过图文结合的方式帮助开发者彻底理解数组本质,并提供Arrays工具类的实用方法与面试高频问题解析,助你掌握数组核心知识,避免常见错误。
|
5月前
|
Java 大数据 Go
从混沌到秩序:Java共享内存模型如何通过显式约束驯服并发?
并发编程旨在混乱中建立秩序。本文对比Java共享内存模型与Golang消息传递模型,剖析显式同步与隐式因果的哲学差异,揭示happens-before等机制如何保障内存可见性与数据一致性,展现两大范式的深层分野。(238字)
153 4
|
5月前
|
存储 缓存 Java
【深入浅出】揭秘Java内存模型(JMM):并发编程的基石
本文深入解析Java内存模型(JMM),揭示synchronized与volatile的底层原理,剖析主内存与工作内存、可见性、有序性等核心概念,助你理解并发编程三大难题及Happens-Before、内存屏障等解决方案,掌握多线程编程基石。
|
6月前
|
缓存 监控 Kubernetes
Java虚拟机内存溢出(Java Heap Space)问题处理方案
综上所述, 解决Java Heap Space溢出需从多角度综合施策; 包括但不限于配置调整、代码审查与优化以及系统设计层面改进; 同样也不能忽视运行期监控与预警设置之重要性; 及早发现潜在风险点并采取相应补救手段至关重要.
826 17
|
7月前
|
监控 Kubernetes Java
最新技术栈驱动的 Java 绿色计算与性能优化实操指南涵盖内存优化与能效提升实战技巧
本文介绍了基于Java 24+技术栈的绿色计算与性能优化实操指南。主要内容包括:1)JVM调优,如分代ZGC配置和结构化并发优化;2)代码级优化,包括向量API加速数据处理和零拷贝I/O;3)容器化环境优化,如K8s资源匹配和节能模式配置;4)监控分析工具使用。通过实践表明,这些优化能显著提升性能(响应时间降低40-60%)同时降低资源消耗(内存减少30-50%,CPU降低20-40%)和能耗(服务器功耗减少15-35%)。建议采用渐进式优化策略。
351 1
|
8月前
|
自然语言处理 Java Apache
在Java中将String字符串转换为算术表达式并计算
具体的实现逻辑需要填写在 `Tokenizer`和 `ExpressionParser`类中,这里只提供了大概的框架。在实际实现时 `Tokenizer`应该提供分词逻辑,把输入的字符串转换成Token序列。而 `ExpressionParser`应当通过递归下降的方式依次解析
427 14
|
8月前
|
SQL 缓存 安全
深度理解 Java 内存模型:从并发基石到实践应用
本文深入解析 Java 内存模型(JMM),涵盖其在并发编程中的核心作用与实践应用。内容包括 JMM 解决的可见性、原子性和有序性问题,线程与内存的交互机制,volatile、synchronized 和 happens-before 等关键机制的使用,以及在单例模式、线程通信等场景中的实战案例。同时,还介绍了常见并发 Bug 的排查与解决方案,帮助开发者写出高效、线程安全的 Java 程序。
434 0