信息量为什么要表示成对数的形式——问题整理

简介: 信息量为什么要表示成对数的形式——问题整理

零、问题引入


有人问一件事发生后所携带的信息量为什么要表示成事件发生概率的对数的形式,我在上通信原理时,ppt上是这样的


0a2653c851af460fa595bd959398a8f1.png


一、香农的信息论


香农指出:“人们只有在两种情况下有通信的需要。其一,是自己有某种形式的消息要告知对方,而估计对方不知道这个消息;其二,是自己有某种疑问要询问对方,而估计对方能做出一定的解答。”


所谓的信息,就是**以前不知道现在知道的事实,**如果某件事以前就知道,当别人再告诉你时,你会忽略,这件事对你的认知没有任何影响,这就不叫信息,反之,如果某件事以前你不知道,有人告诉你了,你现在知道了,那么对你而言,这件事就是信息。

我们看下用概率描述信息量的重要性质:


1.事件发生的概率越低,信息量越大;

2.事件发生的概率越高,信息量越低;

3.多个事件同时发生的概率是多个事件概率相乘,总信息量是多个事件信息量相加。

通过前两点,我们知道信息量,信息量和概率之间一定是减函数的关系,第三点要求确定了对数关系:

y=log2xy=log2⁡x


这里的对数关系以及上述第三点其实非常好理解,即两件事情的信息量之和等于两件事情同时发生的信息量:


x1和x2同时发生的概率:P(x1,x2)=P(x1)×P(x2)

x1和x2的总信息量:log2(P(x1)P(x2))=log2P(x1)+log2P(x2)


由此确定的信息量描述为:


I(x)=−log2P(x)I(x)=−log2⁡P(x)


也许看起来好像香农是拍脑袋拍出对数关系的,但不管怎样,这个式子能完美诠释他想要诠释的一切,这就是他天才的地方。这个式子简单,优美,是的,非常简单,就像E=mc2E=mc2一样简单,优美。


既然有了一件事发生的信息量的数学描述,给出事件确实发生后信息量的数学期望就简单了,它便可以被描述为:


H(X)=E(I(X))=∑ni−P(xi)log2P(xi)H(X)=E(I(X))=∑in−P(xi)log2⁡P(xi)


这很好理解,事件发生的形式拥有不同的概率,每种可能性发生后的信息量乘以它发生的概率,将其加起来,就是事件发生后总信息量的数学期望。


以上就是关于信息的数学描述,首先我们要明白用对数可以定义一件特定事件发生后的信息量,其次我们要知道一个事件按照不同概率的特定形式发生后的信息量的数学期望。

 

0a2653c851af460fa595bd959398a8f1.png


接下来我来针对这些数学式子做一个现代解释。


二、信息的二进制解释


现代计算机科学强调一切都是比特(bit),那么如果我们想描述一个信息,显而易见的形式当然是bit。所谓的信息量就是用多少bit可以描述一个事件。这件事不妨反过来理解,我来理一下:


1个bit可以描述2个事件

2个bit可以描述4个事件

3个bit可以描述8个事件;

n个bit可以描述m个事件;


现在我们来看下n和m的关系:


m=2nm=2n

n=log2mn=log2⁡m


我把式子整理一下就清晰了:


n=−log21mn=−log2⁡1m


0a2653c851af460fa595bd959398a8f1.png


此处,mm中可能性提出负号整理之后变成了1m1m的概率,符合香农的公式形式和含义从这个二进制的意义上去理解信息论中信息量的式子,是不是更简单呢。


0eacb84100b54626af849e6b562bf92a.png


不仅仅是帮助理解信息论,其实本节的内容连同香农的信息论可以指导如何用最短的bit来编码特定的信息,比如霍夫曼编码,出现概率越大的字符编码长度越短,详情请自行百度。


三、为什么第三点的要求就能确定对数形式?


多个事件同时发生的概率是多个事件概率相乘,总信息量是多个事件信息量相加。


给出数学解释

0a2653c851af460fa595bd959398a8f1.png0eacb84100b54626af849e6b562bf92a.png


相关文章
|
18天前
|
编解码 开发工具 git
技术心得记录:小波变换(wavelettransform)的通俗解释(一)
技术心得记录:小波变换(wavelettransform)的通俗解释(一)
10 0
|
2月前
|
存储 Windows
R 语言数值实验中常见技巧整理
R 语言数值实验中常见技巧整理
75 0
R 语言数值实验中常见技巧整理
|
2月前
|
数据采集 安全 数据挖掘
【数据挖掘】属性及其类型和数据的统计描述四分位数等详解(图文解释 超详细)
【数据挖掘】属性及其类型和数据的统计描述四分位数等详解(图文解释 超详细)
173 0
|
8月前
|
算法
代码随想录算法训练营第二十六天 | LeetCode 39. 组合总和、40. 组合总和 II、131. 分割回文串
代码随想录算法训练营第二十六天 | LeetCode 39. 组合总和、40. 组合总和 II、131. 分割回文串
32 0
|
算法 Java 网络架构
代码随想录训练营day27| 39. 组合总和 40.组合总和II 131.分割回文串
代码随想录训练营day27| 39. 组合总和 40.组合总和II 131.分割回文串
|
数据可视化 数据挖掘 Python
答读者问:R语言批量做一元线性回归的简单小例子
答读者问:R语言批量做一元线性回归的简单小例子
python编程作业--盐度对流方程的差分格式设计与讨论
python编程作业--盐度对流方程的差分格式设计与讨论
python编程作业--盐度对流方程的差分格式设计与讨论
|
机器学习/深度学习 算法 数据挖掘
特征工程入门:应该保留和去掉那些特征
特征工程入门:应该保留和去掉那些特征
191 0
特征工程入门:应该保留和去掉那些特征
|
算法 搜索推荐
漫画算法:找出缺失的整数
题目:一个无序数组里有99个不重复正整数,范围从1到100,唯独缺少一个整数。如何找出这个缺失的整数?
131 0
漫画算法:找出缺失的整数
|
机器学习/深度学习 人工智能
【集合论】容斥原理 ( 包含排斥原理 | 示例 )
【集合论】容斥原理 ( 包含排斥原理 | 示例 )
243 0