当前位置: 华文星空 > 知识

香农的信息论究竟牛在哪里?

2016-04-28知识

香农真正伟大的工作是,他用数学描述了信息,让信息变得可测。

什么是让信息变得可测呢?我给你讲个故事:

非洲很多部落都敲鼓,你以为这些都是他们的音乐吗?其实完全不是,它们是有功能性的。撒哈拉以南的非洲人,用鼓点传递信息是非常常见的。虽然不是每个部落成员都会敲,但差不多大家都能听懂鼓声。

你觉得鼓声和消息是怎么转化的呢?有些人脑中天然就会想到摩尔斯码,比如用鼓的高音代表0,用低音代表1,然后0和1的组合拼出字母,字母再组成文字。

这是思路,都是用现代文明来理解非常原始的部落。它是错的。

这个思路里鼓声和信息之间存在好几次转换,但在真实情况中,非洲上千种语言中的绝大部分压根就没有文字,就和纳瓦霍语是一样的。所以其实非洲的鼓声,就是当地语言的另一种发音方式。

但马上会出现问题了,比如说:两个高音鼓点敲出来,它代表的意思可就多了,有时候可能是月亮,有时候可能代表鸡,有时候可能代表鱼,有的时候也可以是男人的意思。

怎么用鼓点准确传达消息呢?方法也有,就是让鼓多说一些话。

比如,妻子叫丈夫快点回家吃饭,用鼓点打出来,完整翻译过来的意思就是:

森林里的男人精灵, 回来回来。 回到属于森林里男人精灵的高高的木屋中, 女人和木薯在等待着你, 回来回来。

你看,翻译过来跟诗一样。这样翻译出来废话就特别多,但这是必要的。

因为如果后面不跟着那么多修饰词和与之相关的动词名词,人们是很难判断鼓声要表达的意思是男人还是鱼儿。当「回到男人精灵高高的木屋中」表达出来后,那一定不可能是鱼儿的木屋了。

好,我们现在来看,如果我们把鼓点当做一种语言,这种语言的「音素」就只有两个——高音和低音。

这是一种貌似简练至极的表达,但为了传达消息的准确,就必须在说话时反复使用大量音素。而用英语喊男人回来,只需要几个音素就够用了,可英语中的音素又有上百个之多。

虽然我们现在还没法衡量具体的数字,但我们可以隐约感受到:

传播同一则信息,信息的量好像弹性空间很大,我们应该如何测一测这个信息的量呢?如果这个信息的量是可测,那么要传递一条信息,有没有量的下限呢?也就是说,我们至少要用去多少个单位量才能完整表达这条信息呢?我们甚至还可以进一步想,要传递一条信息最少需要多少卡路里的能量呢?

而这些问题的知识,就是香农做出来的。香农不但做出了这些,还用数学完整建立了通信原理。

回顾香农的童年,也能感受到整个社会都在积累着让通信原理迸发出来的气氛。

他是1916年出生的,那时候每个人家的附近,不管是农场、牧场、私人院落,到处布着带倒刺的铁丝网。虽然从某些意义上说铁丝网是一种伟大的发明,但在1920s时代,布下铁丝网的初衷是希望设置障碍。

但没想到在香农的眼中,铁丝网布得越密,就越有利于把人们连接起来,因为他只要在正确的节点把固定的铁丝还有金属U形钉,换成绝缘的夹子,再把电池和话筒接到铁丝网上,就可以简陋的实现免费电话功能了。

而且在那个年代,柯南·道尔的【福尔摩斯探案集】、凡尔纳的科幻小说,都是香农最喜欢的书。而这些书里经常出现主人公破解密文的情节。

你看,在香农出生前的电报时代,和电报时代之前的摩尔斯电码,甚至摩尔斯电码时代之前的欧洲密文通讯,无不一点一滴地塑造着后代人脑中编码的思想。

所以甚至可以评价说:

不但发明不重要,连伟人也不那么伟大。在那种社会土壤中,就算没有香农A出生,也一定会出现香农B、香农C。

香农在学生时代成绩很好,高中提前一年就毕业了,进入到离家不远的密歇根大学。1936年毕业后,顺利的在麻省理工找到了一个研究工作。

当年美国和电相关工作,就是三个——麻省理工、贝尔实验室和通用电气。这三个算名门正派,后世几乎所有电气工程和通信行业的牛人都出自这三个地方。

香农当时负责的工作是,操作微分分析机。虽然香农当年没听说过巴贝奇曾经在100年前制造出了一台差分机,但他负责的这个微分分析机和巴贝奇当年的机器,多少还是有点相似之处的。

它们都是靠机械部件运转的。只不过1936年的微分分析机已经有100多吨重了,沉重的部件用马达驱动,能用电子元件的部分都改用了电子元件。

操作微分分析机其实只需要按步骤来就可以,香农的领导当时是个数学家,实在不屑于做这种重复繁重的体力劳动,所以才特地找了一个应届毕业生帮他做。

但香农也不是甘于做重复工作的人,他对这台可以做微分运算的机器仔细研究了一番,就意识到:机器中开关的切换,本质上并不是在传输电流,而是在传输状态,或者说传输一个事实、一个信息。所以,能不能用一套符号来描述状态的传输和转换呢?

后来,随着机器中电子元器件的比例越来越大,香农开始把不同电路输出的结果也用逻辑学中的符号代替。

比如,并联电路就具有或(or)运算的效果,也就是多条输入里只要有一条是1,输出的结果就是1;而元件在串联电路中的效果和与(and)运算是一样的,也就是需要大家都通电,最后输出的结果才是通电状态。

香农后来又把这种分析方法推广到网状、星状电路中,结合二进制,最后就可以分析很多复杂电路的输出结果。再后来,香农甚至还把这些想法运用到了遗传学上。

现在全世界每个通信工程的从业者,都在跟随着当年香农的理论,计算着信息传输中的带宽、压缩率、编码的成本。而这一切,都源于香农把信息量化的念头。