0.1 + 0.2 不等于 0.3?原来是因为这个

简介: 0.1 + 0.2 不等于 0.3?原来是因为这个

   现象:不听话的小数  01

我们先来看两个现象:

  • 0.1 + 0.2 ≠ 0.3


  • 2.55.toFixed(1) = 2.5, 而 1.55.toFixed(1) = 1.6

但凡你稍微有点前端开发经验,第一个现象你就一定见过,而第二个现象却相对少见,不过其实它们底层的原理是相通的,让我们看看这里到底发生了什么。

   背景:数学知识  02

为了更好的理解后面的计算原理,我们先来复习一些数学知识:

  • 在数学里,小数是可以无限位的,但计算机存储介质有限,不可能全部存下,因此在计算机领域的所有小数都只是个近似值。
  • 科学计数法是一种计数方式,把一个数表示成a与10的n次幂相乘(1≤ |a| < 10),缩写:aEn = a * 10^n。
  • 用科学计数法可以免去浪费很多空间和时间。
  • 一个数的负n次幂等于这个数的n次幂的倒数,10^-2 = 1 / (10^2) = 1/100。
  • 十进制的近似值:四舍五入,二进制的近似值:零舍一入。

   溯源:二进制转换   03

正整数的转换方法除二取余,然后倒序排列,高位补零。

例如65的转换

(65转二进制为 1000001,高位0后为01000001负整数的转换方法将对应的正整数转换成二进制后,对二进制取反,然后对结果再加一(这个操作实际上是一个便捷操作,其底层原理涉及到补码知识,感兴趣的可以看看文末的参考资料 )





例如-65先把65转换成二进制 01000001逐位取反:10111110再加1:10111111(补码)

小数的转换方法对小数点以后的数乘以2,取整数部分,再取小数部分乘2,以此类推……直到小数部分为0或位数足够。取整部分按先后顺序排列即可。











例如123.4:0.4*2=0.8 ——————-> 取00.8*2=1.6 ——————-> 取10.6*2=1.2 ——————-> 取10.2*2=0.4 ——————-> 取00.4*2=0.8 ——————-> 取0………… 后面就是循环了按顺序写出:0.4 = 0.01100110……(0110循环)整数部分123的二进制是 1111011则123.4的二进制表示为:1111011.011001100110……

发现了什么?十进制小数转二进制后大概率出现无限位数!但计算机存储是有限的啊,怎么办呢?来,我们接着看。

   溯源:浮点型存储机制   04

浮点型数据类型主要有:单精度(float)双精度(double)

  • 单精度浮点数(float)

在内存中占4个字节、有效数字8位、表示范围:-3.40E+38 ~ +3.40E+38

  • 双精度浮点数(double)

在内存中占8个字节、有效数字16位、表示范围:-1.79E+308 ~ +1.79E+308

   溯源:IEEE 754与ECMAScript  05

IEEE 754

所谓 IEEE754 标准,全称 IEEE 二进制浮点数算术标准,这个标准定义了表示浮点数的格式等内容,类似这样:


value = sign x exponent x franction

也就是浮点数的实际值,等于符号位(sign bit)乘以指数偏移值(exponent bias)再乘以分数值(fraction)。

在 IEEE754 中,规定了四种表示浮点数值的方式:单精确度(32位)、双精确度(64位)、延伸单精确度、延伸双精确度。ECMAScript 对于IEEE754的实践

ECMAScript 中的 Number 类型使用 IEEE 754 标准来表示整数和浮点数值,采用的就是双精确度,也就是说,会用 64 位来储存一个浮点数。

在这个标准下,我们会用1位存储 S(sign)0 表示正数,1 表示负数11位存储 E(exponent) + bias,对于11位来说,bias 的值是 2^(11-1) - 1,也就是 1023。用 52 位存储 Fraction举个例子,就拿 0.1 来看,对应二进制是 1 * 1.1001100110011…… * 2^-4, Sign 是 0,E + bias 是 -4 + 1023 = 1019,1019 用二进制表示是 1111111011,Fraction 是 1001100110011……

对应 64 位的完整表示就是:


0 01111111011 1001100110011001100110011001100110011001100110011010

同理, 0.2 表示的完整表示是:


0 01111111100 1001100110011001100110011001100110011001100110011010

可以看出来在转换为二进制时



0.1 >>> 0.0001 1001 1001 1001...(1001无限循环)0.2 >>> 0.0011 0011 0011 0011...(0011无限循环)

将0.1和0.2的二进制形式按实际展开,末尾补零相加,结果如下:




0.00011001100110011001100110011001100110011001100110011010+0.00110011001100110011001100110011001100110011001100110100=0.01001100110011001100110011001100110011001100110011001110

用科学计数法表示为:


1.001100110011001100110011001100110011001100110011010 * 2^(-2)

省略尾数最后的0,即:


1.00110011001100110011001100110011001100110011001101 * 2^(-2)

因此 0.1 + 0.2 实际存储时的形式是:


0 01111111101 0011001100110011001100110011001100110011001100110100

再转十进制为:0.30000000000000004

好了,奇怪的东西出现了, 0.1 + 0.2 竟然不等于 0.3!


计算机存储双进度浮点数,需要先把十进制转换为二进制的科学计数法形式,然后计算机以一定的规则(IEEE 754)存储,因为存储时有位数限制(双进度8字节,64位),末位就需要取近似值(0舍1入),再转换为十进制时,就造成了误差。破案!收工。

   解法   06

既然知道问题所在了,那么有什么好的解决办法呢?这里给大家提供几种思路。

简单解法

  • 纯展示类

比如你从后端拿到 2.3000000000000001 这种数据要展示时,可以先用 toPrecision 方法保留一定位数的精度,然后再 parseFloat 后显示


parseFloat(2.3000000000000001.toPrecision(12)) === 2.3 // true

网上有人给出了这里的默认精度建议为 12,这是一个经验值,一般12位足够解决掉大部分0001和0009问题,如果需要更精确可以自己调整即可。

  • 运算类

对于需要计算的场景(四则运算),就不能粗暴的用 toPrecision了。一个更好的做法是把小数转成整数后再运算。

我们可以把需要计算的数字升级成计算机能够精确识别的整数(乘以10的n次幂),等计算完成后再进行降级(除以10的n次幂),这是大部分语言处理精度问题常用方法。


0.1 + 0.2 === 0.3 //false(0.1 * 10 + 0.2 * 10)/10 === 0.3 //true(0.1 * 100 + 0.2 * 100)/100 === 0.3 //true35.41 * 100 === 3540.9999999999995 // true// 即使扩大再缩小 还是会有丢失精度的问题(35.41 * 100 * 100)/100 === 3541 //false  Math.round(35.41 * 100) === 3541 //true

看起来还不能单纯的用扩大缩小法来解决丢失精度的问题 。

我们可以将浮点数toString后indexOf("."),记录一下两个值小数点后面的位数的长度,做比较,取最大值(即为扩大多少倍数),计算完成之后再缩小回来。


// 加法运算function add(num1, num2) {  const num1Digits = (num1.toString().split('.')[1] || '').length  const num2Digits = (num2.toString().split('.')[1] || '').length  const multiplier = 10 ** Math.max(num1Digits, num2Digits)  return (num1 * multiplier + num2 * multiplier) / multiplier}

第三方库

在一些对数据精度要求极高的场景,可以直接使用一些现成的库,这些库本身封装了较为复杂的计算方式,相对而言更加精准,比如处理大数的 bignumber.js,处理小数的number-precision 和 decimal.js,都是不错的库。


   类似问题   07

还记得我们最开始展示了两种现象?上面我们只还原了第一个现象(即 0.1 + 0.2问题),接下来我们简单聊下 Number.toFixed 产生的四舍五入问题。再看下这个现象:

我们用 toPrecision 多保留点精度看下:

原来如此!toFixed 方法会根据你传入的精度对数字进行四舍五入,而2.55实际上是2.54999……取1位精度的话,由于第二位是4,四舍五入之后就是2.5。而1.55如果取1位精度的话,由于第二位是5,四舍五入后就是1.6。

那此类问题又是怎么解呢?网上给了一种通用的解法,在四舍五入前,给数字加一个极小值,比如 1e-14:

这样处理后,大部分场景下的精度基本都够用了。这里我们采用的极小值是10的负14次方(1e-14),有没有一个官方推荐的极小值常量呢?嘿,巧了,还真有!ES6在 Number 对象上新增了一个极小的常量Number.EPSILON:


Number.EPSILON// 2.220446049250313e-16Number.EPSILON.toFixed(20)// "0.00000000000000022204"

引入一个这么小的量,目的在于为浮点数计算设置一个误差范围,如果误差能够小于Number.EPSILON,我们就可以认为结果是可靠的。可以抽一个误差检查函数:



// 误差检查函数function withinErrorMargin (left, right) {  return Math.abs(left - right) < Number.EPSILON}
withinErrorMargin(0.1+0.2, 0.3)

看,0.3 - ( 0.1 + 0.2 ) 的误差是1e-17次方,小于 Number.EPSILON,那么我们就认为二者在大部分场景下是等值的。


解法总结

1.  数据展示类,可以直接使用toPrecision(12)凑整,再parseFloat后展示

2.  浮点数计算类,取二者中小数位数最长者(记为N),同时乘以10的N次幂,转换为整数进行计算,再除以N次幂转回小数

3.  需要用toFixed取近似值的地方,可以先加上1e-14或Number.EPSILON,再取。

4.  判定两个数字相等,可以使用Math.abs(left - right) < Number.EPSILON

5.  实在不会,就直接用别人写好的成熟库吧。

目录
相关文章
|
7月前
【变态面试题】【两种解法】不能创建临时变量(第三个变量),实现两个数的交换
【变态面试题】【两种解法】不能创建临时变量(第三个变量),实现两个数的交换
52 0
【变态面试题】【两种解法】不能创建临时变量(第三个变量),实现两个数的交换
|
7月前
|
Python
一个大于1的自然数,除了1和它本身外,不能被
一个大于1的自然数,除了1和它本身外,不能被
输入一个整数,判断大于0小于0还是等于0
输入一个整数,判断大于0小于0还是等于0
|
28天前
|
数据挖掘 Python
如何判断处理后的数据是否仍然存在重复值?
通过以上任意一种方法,都可以有效地判断处理后的数据是否仍然存在重复值,从而确保数据的准确性和唯一性,为后续的数据分析和处理提供可靠的数据基础。
69 10
|
1月前
使用函数判断Armstrong 数
【10月更文挑战第24天】使用函数判断Armstrong 数。
21 7
交换两个数的值的方法(三种)
交换两个数的值的方法(三种)
72 1
|
7月前
数组地址等于第一个元素地址
数组地址等于第一个元素地址
|
7月前
leetcode-5894:至少在两个数组中出现的值
leetcode-5894:至少在两个数组中出现的值
50 0
变量等于0时的判断问题
变量等于0时的判断问题
84 0