把 Google 当拼写检查器用

人工智能(Artificial Intelligence)在其短暂的历史中经历了不少大起大落。既有着50年代研究人员对发明“和人类一样聪明的机器”的乐观判断,也有着70年代和 90年代两次“AI的冬天”。对于IT界来说,人工智能之前的表现差强人意,投资人和各公司都赔了不少钱。不过,进入2012年,在技术上的种种客观条件 的变化,尤其是云计算的盛行,也许会使人工智能迎来一个真正的上升期。

在本周的一个讨论会上,来自MIT商学院的Michael Schrage教授提出了有关云计算和机器学习的问题(Machine learning)。马克·安得森则表示,机器学习实现人工智能真正的方法恐怕不是教会电脑像人类一样思考,而是用算法去处理极其大量的数据,而云计算和 云存储将会在这里发挥极其巨大的作用。在说到这个现象时,他举了一个非常有趣而又吸引人的例子,那就是很多人会把Google当成一个拼写检查器来用。我 们所说的检查拼写不仅仅包括了英语单词的拼写,还有中文语法的搭配,成语用法,甚至是一些古诗词中的用字,以及不断涌现的网络流行语,等等。检查拼写一直 以来都是一个经典的人工智能问题,因为在这个问题之中我们的目的就是要教会电脑像人一样说话,让它们学会人类语言的词汇、语法、句型,然后再拿这些我们教 给电脑的规则来检查我们的语言和语法。

 

 

一 直以来,专业的拼写检查器(spell checker)都没有达到人们的应用要求,其原因有很多。比如说,人类的语言是极其复杂而且内容繁多的,有非常多的规则需要设计,同一句话可表达不同意 思,不同的话可表达相同意思,流行语更新很快,等等。比较起来,目前最先进的拼写检查工具不是任何一个专业的工具,而是搜索引擎! 很多用户大概都有过这种经历,就是对于一个句子,一个单词,一句古诗不确定的时候,拿Google或者百度搜一下。有意思的是,不管Google还是百度 都不是作为拼写检查器被设计出来的,而且他们也没有专门的“拼写检查”功能。之所以这个歪打正着的功能居然这么好用,是因为它收集而且组织了极其大量的信 息。搜索引擎能看到所有人们提出的问题,所以如果你在拼写中或者用词中犯了一个错误,它能通过比对海量数据来预测出你的这个错误 – 而结果就是搜索引擎事实上成为了目前为止最先进的拼写检查器。

相同的方法和原理在人工智能、预测分析学的很多其他方面都有着应用,比如人脸 识别技术,等等。这些应用的基础只有一个 – 那就是极其大量的数据。从这个角度上说,云存储和云计算带来的大量数据也许会对类似的应用带来无限的机会,怪不得Peter Thiel前段时间又一反传统观点的预测人工智能的黄金时代刚刚开始。把Google当拼写检查器用 – 这个有趣的现象值得我们好好去观察和思考,也许海量数据真的会带来人工智能的新时代。