互信息熵和联合熵区别,熵增因素

2023-08-28 9230阅读 0评论

互信息熵和联合熵区别,熵增因素 第1张

最近用到信息论的知识表较多,自己也总结下。

1 信息熵(entropy)

定义式:

其中P(x)是变量出现的概率。从直观上,信息熵越大,变量包含的信息量越大,变量的不确定性也越大。一个事物内部会存在随机性,也就是不确定性,而从外部消除这个不确定性唯一的办法是引入信息。如果没有信息,任何公式或者数字的游戏都无法排除不确定性。几乎所有的自然语言处理,信息与信号处理的应用都是一个消除不确定性的过程。

2 条件熵(conditional entropy)

知道的信息越多,随机事件的不确定性就越小。

定义式:

3 联合熵

设X Y为两个随机变量,对于给定条件Y=y下,X的条件熵定义为:

4 左右熵

一般用于统计方法的新词发现。

计算一对词之间的左熵和右熵,熵越大,越说明是一个新词。因为熵表示不确定性,所以熵越大,不确定越大,也就是这对词左右搭配越丰富,越多选择。如: 火星上的小馒头,这个词,我们希望左右熵都很大,希望火星上的小馒头这个词左右边搭配尽可能丰富,如左边:这火星上的小馒头、臭火星上的小馒头、穷火星上的小馒头;右边:火星上的小馒头的,火星上的小馒头样、火星上的小馒头命等。左右搭配丰富。

5 互信息(mutual information)

两个事件的互信息定义为:I(X;Y)=H(X)+H(Y)-H(X,Y),也就是用来衡量两个信息的相关性大小的量。

互信息是计算语言学模型分析的常用方法,它度量两个对象之间的相互性。

定义式:

应用:

(1)去计算一个变量的不确定性,可以考虑信息熵;在研究显著性时,可以用信息熵去计算一个区域的信息量的大小,近而来判断其为显著性区域;

(2)计算两个变量之间的相关性,可以考虑条件熵;

97490252

《互信息熵和联合熵区别,熵增因素》来自互联网同行内容,若有侵权,请联系我们删除!


免责声明
1、本网站属于个人的非赢利性网站,转载的文章遵循原作者的版权声明。
2、本网站转载文章仅为传播更多信息之目的,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所
提供信息的准确性及可靠性,但不保证信息的正确性和完整性,且不对因信息的不正确或遗漏导致的任何
损失或损害承担责任。
3、任何透过本网站网页而链接及得到的资讯、产品及服务,本网站概不负责,亦不负任何法律责任。
4、本网站所刊发、转载的文章,其版权均归原作者所有,如其他媒体、网站或个人从本网下载使用,请在
转载有关文章时务必尊重该文章的著作权,保留本网注明的“稿件来源”,并白负版权等法律责任。

手机扫描二维码访问

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (暂无评论,9230人围观)

还没有评论,来说两句吧...

目录[+]