GPT图解:大模型是怎样构建的
上QQ阅读APP看书,第一时间看更新

何为语言?信息又如何传播?

咖哥哈哈一笑:你说得还真对。最早的语言啊,是以声音为媒介,通过话语进行传送的,使用同一种语言,就显得很重要。我国幅员辽阔,各地方言多如牛毛,所谓“十里不同音,百里不同俗”。为了方便交流,消除方言隔阂,国家推广使用普通话。不过其实啊,早在两千多年前,古人就研究过这个问题。古代版的普通话叫“雅言”。春秋时期,孔子的三千弟子来自五湖四海,这就必然需要孔子用一种被大家共同认可的语言来讲学。孔子会用什么语言讲学呢?《论语·述而第七》中记载:“子所雅言,《诗》、《书》、执礼,皆雅言也。”

当然,口头传播信息有明显的缺点,信息非常不易积累,也很难传播,所以原始人类开始使用结绳、刻契、图画的方法辅助记事,后来又用图形符号来简化、取代图画。当图形符号简化到一定程度,并形成与语言的特定对应时,早期的文字就形成了(见下页图)。无论是最古老的象形文字、楔形文字,还是甲骨文,以及现代文字,它们的作用都是承载信息。

早期的文字

没有口头话语,没有书面文字,我们就无法沟通。所以,语言是信息的载体。口头话语和书面文字都是语言的重要组成元素。

有了语言,就有了信息沟通的基础。不过,除了语言这个信息载体之外,我们还需要在信息的通道中为语言编码和解码。一个只说英语的人,面对一个听不懂英语的中国人,他们虽然都使用语言,但是不能相互解码,所以无法沟通。同理,计算机也不能直接理解人类的自然语言。因为缺少编码和解码的过程。因此,要让计算机理解我们人类的语言,就要对语言进行编码,将其转换成计算机能够读懂的形式

而这个编码和解码的任务,可以简化成如下图所示的简化的通信模型。

简化的通信模型

上图中,信息的发送人把想要发送的信息通过一种编码方式(绘画、文字、声音等)进行编码,然后通过信道把被编码后的信息传给接收人,接收人对其进行解码,从而获取信息的内容。