返回第591章 伦道夫之问  鸦的碎碎念首页

关灯 护眼     字体:

上一页 目录 下一页

眼就认出对方了。

乔治&183;布希,阿美莉卡驻联合国大使。

「大使先生?」米勒试图让自己镇定,「如果这是因为我在《纽约时报》上发表的那篇关于语言结构的文章,我想宪法第一修正案应该————」

「这与文章无关,乔治。」布希打断了他,语气中的焦虑难以掩盖,「虽然我也很喜欢你关于神奇数字7的理论,但今晚,我们需要你解决一个更大的数字问题。」

布希把一张列印纸推到桌子中央。

那是希瓦娜在联合国大会现场的发言。

上面只有短短几行,全是方块字。

「告诉我,博士。为什么是中文?」

布希指着文件上的汉字:「刚才在联合国大会的现场,希瓦娜出现了,她的声音突然出现在现场代表的耳机里。

没错,就是你眼前这些方块字。

尽管外星论坛由联合国官方语言构成,可以实现语言之间翻译,但她说话是用中文。

教授,我们需要你的帮助,需要你的大脑。」

米勒愣了一下。

作为克劳德&183;香农的信徒,作为将资讯理论引入语言学的先驱,米勒的大脑迅速切换到了学术模式。

「不,大使先生。」

米勒推开速溶咖啡,从口袋里掏出派克钢笔,甚至都顾不上找布希要纸,他直接在木桌上画了一条线。

「我想这大概只和信息密度有关。

假设我们现在已经能够去到几百光年外。

我们要和母星进行沟通。

那么我们只会关心一件事,那就是信道的容量和熵。」

「熵?」布希皱眉。

「克劳德&183;香农在1948年提出的概念,信息的不确定性,或者说,信息的密度。」

米勒在桌子上写下了一句英语:

he quik brwn f jup ver he zy dg

「看,大使先生。英语,以及所有的印欧语系,本质上是一种线性的一维编码。它是表音的。为了确保信息在传输中不失真,英语进化出了大量的冗余。」

「为了表达光子这个概念,我们需要六个字母,六个字节。为了构建语法,我们需要he、a、i这些在信息学上几乎为零的噪音词汇。」

「在香农的公式里,英语的平均信息熵大约是每字母10到15比特。如果算上冗余,它的效率其实很低。它就像是莫尔斯电码,为了准确,牺牲了长度。」

接着,米勒在下面写下了两个汉字:

光子他用笔尖点了点那两个方块:「但中文,中文是个怪物。」

「它不是一维的线,它是二维的图。它是表意文字。每一个汉字,都是一个被高度压缩的信息包。它直接指向意义,跳过了声音的转码。」

「根据最新的语言统计学研究,如果不考虑上下文冗余,单个汉字的平均信息熵高达965比特,甚至是11比特以上。」

布希显得有些困惑:「说人话,博士。」

「意思是,在同样的存储空间,或者同样的传输时间内,中文能容纳的信息量是英语的两倍甚至三倍。」

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一页 目录 下一页