人工智能 | 01 梦开始的地方
聊起人工智能,就不得不提到1956年在达特茅斯学院的那个夏天。

人工智能夏季研讨会
聊起人工智能,就不得不提到1956年在达特茅斯学院的那个夏天。

在两个月的时间里,一群计算机界的大佬和即将成为大佬的预备大佬共聚一堂,探讨着“如何用机器模拟智能”的问题。

会议的主要召集人,约翰·麦卡锡(John McCarthy),将这个会议命名为“人工智能夏季研讨会”,从此诞生了“人工智能”这个词。
大佬们之所以要讨论这个问题,是因为著名的计算机科学家图灵在不久前发表了一片论文《计算机器与智能》。

在文章中图灵讨论了使用计算机来模拟人类智能的可能性,并提到了一个用于评价模拟效果如何的方法,称之为“模拟游戏”(游戏Game一词也有比赛的含义)。

把一个人和一台计算机分别关在两个小房间里,房间外有多少比例的人可以通过与它们对话(传递小纸条),判断出来其中哪个是人,哪个是机器。

这也就是后来更为人们所知的“图灵测试”。
信息论
可是,计算机怎么能和人对话呢?

问题的重点不在于如何发声或打印小纸条,因为不论是留声机还是打字机,在当时都是非常成熟的技术了。
重点在于计算机如何能“听懂人话”并作出适当的反应,即便是在60多年后的今天,这依然是人工智能领域还在摸索的问题。
如你所知,我们给机器起名字的时候,是根据它的功能来的。比如洗衣机,就是一种用来洗衣服的机器;电视机,是一种用来看电视的机器;咖啡机,是一种用来做咖啡的机器。

计算机,不过只是一种很擅长计算的机器。

计算是对“数字”的处理,可是人类的语言却是“文字”。这即计算机科学家,也是人工智能科学家们要解决的第一个问题。
与会的另一个大佬,香农,是信息论的奠基人,他巧妙的提出了“信息量”的概念。
我们人类在表达一个意图的时候,可以用很多种不同的表达方式,甚至使用完全不同的语言。
- 今日有雨。
- 今天空中将落下雨滴。
- It rains today.
尽管这些文字如此不同,但是他们在传递着某种相似甚至相同的东西,这就是信息。

香农认为,一句话中所携带的信息有多少,可以通过计算来量化,并且给到了一个非常简洁的公式:
I = -log p
其中p就是这句话中事件发生的概率,而I就是它的信息量了。
让我们在此处做一个简单假设,假如天气只会出现“晴”“雨”两种情况,且发生的概率都一样,即都是1/2。那么如“今日有雨”这样的句子中,所携带的信息量可以通过公式得到答案:
-log(1/2) = 1 bit
也就是说,这句话所携带的信息量为1个比特。
“比特嘛,我熟!”,计算机说。在(二进制)计算机中,一切都是比特。

于是,在计算机中,就可以拿出1个比特,来表达”今日有雨“这句话所携带的信息。比如,用1来表示确实下雨了,而用0来表示不会下雨。

如果我们拿出来365个比特,就可以存储下一整年的天气情况了!这表达效率比文字高多了!
当然,真实的天气情况会更复杂,而信息论的学科大厦也更为庞大,我们这里只是讨论一个最简单的假设。
站在更高的层面来看,中文也好,拉文字母也好,数学符号也好,不过是人们在表达信息时的不同符号体系罢了。

香农通过信息论,在理论层面搭建出一条符号体系之间转化的桥梁。
符号主义
计算的本质,就是符号之间的相互转化。
上过小学的我们,大概都能感受到计算是由数值和运算两类符号组成的。

然后我们可以使用一个新的数值符号“2”来标记“1+1”的计算结果。

还有其它的变化方式,比如引入新的运算符号“X”乘法。

根据信息论的原理,符号的转化并不影响信息量。但是不同的符号对于人们的“阅读体验”来说可太不一样了。

对于而对于数学家来说,这个不只是“阅读体验的问题”,可以想象解方程的过程、定理证明的过程,本质上也都是一种符号转化。

既然如此,是不是可以设计这样一个机器,通过我们给定的初始条件和符号之间的转化规则,它就可以自行遍历出所有合法的表达方式。
这个设想简直太棒了,如果可行的话,我们只需要定义好基本公理,机器就自己可以推导出所有的推论和定理,这样的话机器岂不是就能掌握了所有的知识了?!(甚至比人类已知的还多)
在为期两个月的研讨会中,纽厄尔和西蒙两位大佬,编写程序让机器自己推导出了《数学原理》第2章52个定理中的38个定理。

从这个思路出发,逐渐形成了最早的一个人工智能流派,即符号主义。
基于符号主义衍生出了早期的人工智能的系统——“专家系统”。专家把自己行业中的“基本公理”提炼出来,程序员将其改写为计算机能理解的符号,即代码,来基于“基本公理”来进行推理,来实现对应的功能。

历史上著名的人工智能“深蓝”就是一个国际象棋的“专家系统”,它便是通过遍历出所有可能的落子,然后在1997年打败了人类棋王,登顶冠军。

不过符号主义之路并没有那么顺利,早在1931年,数学家哥德尔就通过他发现的不完备定理,证明了上述设想不可能穷举出所有知识。
图灵为了说明不完备定理,而设计出的一个思维实验机器——图灵机。图灵机在很大程度上启发了冯诺依曼,后者在此基础上设计出了我们今天在使用的计算机的基本构型。

(在未来上线的《计算机原理》专栏中,你可以看到更多关于图灵机和冯诺依曼构型的介绍)
符号主义在今天已不是人工智能界的主流,所以本文不打算继续深入,如果你对这些内容感兴趣,推荐去读侯世达的《集异璧》,去深入理解更多关于符号主义的思想。
