Java float和double精度范围大小(二进制存储角度剖析)

简介: 要想理解float和double的取值范围和计算精度,必须先了解小数是如何在计算机中存储的:下面举例说明:如何将十进制数78.375转换成32位长的IEEE单精度格式。

Java float和double精度范围大小

要想理解float和double的取值范围和计算精度,必须先了解小数是如何在计算机中存储的:

下面举例说明:如何将十进制数78.375转换成32位长的IEEE单精度格式。

1. 小数的二进制转换(浮点数)

78.375的整数部分:请添加图片描述

小数部分:请添加图片描述

所以,78.375的二进制形式就是1001110.011

然后,使用二进制科学记数法,有:请添加图片描述

转换后用二进制科学记数法表示的这个数,有底有指数有小数部分,这个就叫做浮点数。

2. 二进制浮点数转小数

请添加图片描述

3. 浮点数在计算机中的存储

在计算机中,保存这个数使用的是浮点表示法,分为三大部分:

  • 第一部分用来存储符号位(sign),用来区分正负数,这里是0,表示正数
  • 第二部分用来存储指数(exponent),这里的指数是十进制的6
  • 第三部分用来存储小数(fraction),这里的小数部分是001110011

需要注意的是,指数也有正负之分。

请添加图片描述

比如float类型是32位,用浮点数表示法:

  • 符号位(sign)占用1位,用来表示正负数,指数位(exponent)占用8位,用来表示指数,小数位(fraction)占用23位,用来表示小数,不足位数补0。

而double类型是64位,用浮点数表示法:

  • 符号位(sign)占用1位,用来表示正负数,指数位(exponent)占用11位,用来表示指数,小数位(fraction)占用52位,用来表示小数,不足位数补0。

请添加图片描述

4. 指数位的偏移量与无符号表示(float偏移量是127,double偏移量是1023)

需要注意的是指数可能是负数,也有可能是正数,即指数是有符号整数,而有符号整数的计算是比无符号整数麻烦的。所以为了减少不必要的麻烦,在实际存储指数的时候,需要把指数转换成无符号整数。那么怎么转换呢?

意到float的指数部分是8位,则指数的取值范围是 -126到+127,为了消除负数带来的实际计算上的影响(比如比较大小,加减法等),可以在实际存储的时候,给指数做一个简单的映射,加上一个偏移量,比如float的指数偏移量为127,这样就不会有负数出现了。

  • 指数如果是6,则实际存储的是6+127=133,即把133转换为二进制之后再存储。
  • 指数如果是-3,则实际存储的是-3+127=124,即把124转换为二进制之后再存储。

当我们需要计算实际代表的十进制数的时候,再把指数减去偏移量即可。

对应的double类型,存储的时候指数偏移量是1023。

5. java中存储浮点数的方式

用float类型来保存十进制小数78.375的话,需要先转换成浮点数,得到符号位指数小数部分。然后转换为二进制,注意指数要偏移6+127=133。

请添加图片描述

6. IEEE754中的一些概念

在java规范中有说明:浮点数在概念上与IEEE二进制浮点算术标准ANSI/IEEE标准754-1985 (IEEE,纽约)中规定的单精度32位和双精度64位相关联。

归约浮点数:如果浮点数中指数部分的编码值在0<exponent<=(2^e)-2
之间,且在科学表示法的表示方式下,分数 (fraction) 部分最高有效位(即整数字)是1,那么这个浮点数将被称为规约形式的浮点数。“规约”是指用唯一确定的浮点形式去表示一个值。此处e指的是存储指数的比特的长度。

非规约浮点数:、如果浮点数的指数部分的编码值是0,分数部分非零,那么这个浮点数将被称为非规约形式的浮点数。一般是某个数字相当接近零时才会使用非规约型式来表示。 IEEE 754标准规定:非规约形式的浮点数的指数偏移值比规约形式的浮点数的指数偏移值小1。如float偏移量是127,则对应非规约浮点数偏移量是126。

7. float和double的范围到底是多少

Java中float占4个字节,32bit。计算范围公式为 S (2^(E-127))(1.M) ,其中S占一位是符号位,E所占8bit是指数位(E存储时偏移了127),M占23位是尾数位。

从IEEE754规范规约浮点数定义中我们了解到,对于float指数的范围是[1,254],所以float最大值:

请添加图片描述

即float取值范围是:请添加图片描述

double的最大值:

请添加图片描述

即double取值范围是:请添加图片描述

8. 特殊值

这里有三个特殊值需要指出:

  1. 如果指数是0并且尾数的小数部分是0,这个数±0(和符号位相关)
  2. 如果指数(2^e)-1并且尾数的小数部分是0,这个数是±∞)(同样和符号位相关)
  3. 如果指数(2^e)-1并且尾数的小数部分非0,这个数表示为非数NaN。

此处e指的是存储指数的比特的长度。

以上规则,总结如下:

形式 指数 float指数 double指数 小数部分
0 0 0 0
非规约形式 0 0 0 大于0小于1
规约形式 1到 请添加图片描述 [1,254] [1,2046] 大于等于1小于2
无穷 请添加图片描述 255 2045 0
NaN 请添加图片描述 255 2045 非0
参考资料:

官方文档:数据类型

官方文档:浮点数规范

80x86汇编语言与计算机体系结构(戴默)P14

维基百科:IEEE754二进制浮点数算法标准

目录
相关文章
Java中整数(负数)的二进制表示
Java中整数(负数)的二进制表示
|
1月前
|
Java Go 开发工具
【Java】(2)Java数据类型阐述、基本数据类型的占用和范围、二进制的讲述
数据的一种表示形式。十进制表示满十进一原则。二进制表示满二进一原则。例如:十进制例如:二进制计算机在任何情况下都只能识别二进制。
93 0
|
12月前
|
Java
Java项目中高精度数值计算:为何BigDecimal优于Double
在Java项目开发中,涉及金额计算、面积计算等高精度数值操作时,应选择 `BigDecimal` 而非 `Double`。`BigDecimal` 提供任意精度的小数运算、多种舍入模式和良好的可读性,确保计算结果的准确性和可靠性。例如,在金额计算中,`BigDecimal` 可以精确到小数点后两位,而 `Double` 可能因精度问题导致结果不准确。
267 1
|
Java
Java中将一个数转化为二进制
Java中将一个数转化为二进制
180 0
【Java基础面试十】、何对Integer和Double类型判断相等?
这篇文章讨论了如何在Java中正确比较`Integer`和`Double`类型的值,指出不能直接使用`==`操作符比较不同类型,而应该将它们转换为相同的基本数据类型(如`double`)后进行比较。
【Java基础面试十】、何对Integer和Double类型判断相等?
|
Java
Java中将保留四位小数的Double转换为String的方法详解
选择合适的方法,可以使代码更加简洁、高效,同时也能满足不同场景下的需求。
492 5
|
算法 Java Go
【经典算法】LeetCode 67. 二进制求和(Java/C/Python3/Golang实现含注释说明,Easy)
【经典算法】LeetCode 67. 二进制求和(Java/C/Python3/Golang实现含注释说明,Easy)
451 2
|
JavaScript Java
Java long传到前台精度损失解决方案
Java long传到前台精度损失解决方案
152 1
|
存储 SQL 数据库
MySQL设计规约问题之为何推荐用DECIMAL代替FLOAT和DOUBLE来存储精确浮点数
MySQL设计规约问题之为何推荐用DECIMAL代替FLOAT和DOUBLE来存储精确浮点数
|
Java 程序员
【JAVA面试题】基本类型的强制类型转换是否会丢失精度?引用类型的强制类型转换需要注意什么?
【JAVA面试题】基本类型的强制类型转换是否会丢失精度?引用类型的强制类型转换需要注意什么?

热门文章

最新文章