《AI·未来》
上期提要:看了柯洁比赛的人,也对他报以同样的爱意。AlphaGo获得了比赛的胜利,落败的柯洁却成了人们心目中的斗士。
“神经网络”阵营则另辟蹊径,他们不把人脑熟稔的逻辑规则传授给计算机,而是干脆在机器上重建人脑。科学研究结果已经得知,动物的智能只有一个源头——动物脑部错综复杂的神经元网络,于是这个阵营的研究人员决定从根源做起,模仿人脑结构,构建类似生物神经元网络的结构来收发信息。不同于规则式方法,人工神经元网络的建造者通常不会给人工智能系统设定决策规则,而只是把某一现象(图片、国际象棋赛、人声等)的大量例子输入人工神经元网络,让网络从这些数据中学习、识别规律。换言之,神经网络的原则是来自人的干预越少越好。
用这两种方法处理某个简单问题如“辨识一张图片里是否有猫”,就可以看出它们的差别。规则式方法确定以“若X,则Y”的逻辑规则来帮助程序做出决策:“若一个圆形物体上方有两块三角形,那么,这张图片中可能有一只猫。”神经网络方法则是把数百万张标示了“有猫”或“没有猫”的样本图片“喂”给计算机系统,让它自行从这数百万张图片中去辨察哪些特征和“猫”的标签最密切相关。
20世纪50年代到60年代,早期的人工神经网络获得了乐观且让人振奋的成果。但到了1969年时,规则式阵营予以还击,使得很多研究人员认为神经网络法不可靠且用途有限。神经网络方法很快“退烧”,人工智能随之在20世纪70年代陷入了早期的寒冬。
接下来数十年,神经网络方法在短暂的时间内恢复了一些声望,但后来又几乎被完全放弃。1986年,我使用一种近似神经网络、名为“隐马尔可夫模型”(HiddenMarkovModels)的方法,建造出世界上第一套非指定语者连续性大词汇语音识别系统Sphinx。这项成就使我登上了《纽约时报》(TheNewYorkTimes),该系统也被《商业周刊》(BusinessWeek)评为年度最重要创新产品,但这并没有改变神经网络法再度失宠的命运,几乎在整个20世纪90年代,人工智能再度陷入了冗长的寒冬期。
最终使神经网络法复活,并让人工智能再次复兴的,是神经网络系统赖以存在的两项要素出现的变化,再加上一项重大的技术性突破。神经网络需要大量的计算机运算力及数据:大量的样本数据输入系统,以“训练”程序去辨识形态,计算机运算力则让程序得以高速分析样本数据。
人工智能问世的20世纪50年代,数据来源不多,运算力也不强。互联网的崛起带来了海量的数据:文本、图像、视频和点击、购买的数据等。如此多的数据,成了研究人员手中源源不绝的试验材料,用来训练他们构建的人工神经网络。同时,他们可以使用的运算力也变得又强大又便宜。例如你手中智能手机的运算力,甚至比美国国家航空航天局1969年登月计划中最先进计算机的运算力还高出几百万倍。这两项变化结合起来,为神经网络法的发展提供了优良条件。
不过,人工神经网络能做的事仍然非常有限。复杂问题若要得出准确的结果,必须构建很多层的人工神经元,但神经元层数增加后,研究人员当时还未找到针对新增神经元有效的训练方法。在21世纪头10年的中期,深度学习这项重大的技术性突破终于到来,知名研究人员杰弗里·辛顿找到了有效训练人工神经网络中新增神经元层的方法。这就像是给旧的神经网络打了一针兴奋剂,使它们的能力倍增,可以执行更多、更复杂的工作,例如语音及物体识别。
性能大增的人工神经网络——现在有了新的名字“深度学习”——开始把旧的系统远远甩在身后。多年来对神经网络根深蒂固的成见让人工智能的许多研究人员忽略了这个已经取得出色成果的“边缘群体”,但2012年杰弗里·辛顿的团队在一场国际计算机视觉竞赛中的胜出,让人工神经网络和深度学习重新回到聚光灯下。
在边缘地带煎熬了数十年后,以深度学习的形式再次回到公众视野中的神经网络法不仅成功地让人工智能回暖,也第一次把人工智能真正地应用在现实世界中。研究人员、未来学家、科技公司CEO都开始讨论人工智能的巨大潜力:识别人类语言、翻译文件、识别图像、预测消费者行为、辨别欺诈行为、批准贷款、帮助机器人“看”,甚至开车。
揭开深度学习的面纱
深度学习是怎么做到的呢?本质上来说,深度学习的算法使用了大量来自特定领域的数据,为想要的结果做出最佳决策。其方法是让系统使用这些输入的数据,训练自己识别数据和期望结果之间的关联性。当数据与期望结果直接相关(“猫”vs“非猫”,“点选”vs“未点选”,“赢了赛局”vs“输了赛局”)时,这个流程就容易多了。然后,算法可以运用找到的这些关联性所累积的庞大知识(其中很多是人类看不到或觉得无关的),做出比人类更好的决策。
这么做需要大量的相关数据、强大的算法、足够细化的领域以及明确的目标,欠缺任何一个都无法成功。数据太少则样本不够,算法无法发现有意义的联系;但如果目标太广泛,算法则缺乏衡量最优解的明确标准。
深度学习是所谓的“狭义人工智能”(narrowAI,或译作“弱人工智能”)——仅用于在特定领域能做出决策、预测和分类的人工智能应用。这已经能产生巨大价值,但仍远远未成为科幻片里的“通用人工智能”(generalAI,或译作“强人工智能”)——人类能做的,人工智能都可以做。
深度学习最自然的应用领域是保险、贷款之类的金融业务,因为借款人的相关数据非常多(信用评分、收入、信用卡近期使用情况等),而最优的目标(降低还款违约率)很明确。更进一步的话,深度学习还可以进行自动驾驶,帮助车辆“看”到行驶的路况,如识别像素组成的形状(比如红色圆形),判断它和什么有关(比如红灯“禁行”),以此信息来做出决策(刹车并停车),以达到期望的结果(用最少的时间把我安全送到家)。
人们听到深度学习就兴奋,是因为它的核心能力——识别规律、得出最优解、做出决策可应用在很多日常问题上,所以,包括谷歌、Facebook在内的许多公司争相出高薪聘请为数不多的深度学习专家,开展它们雄心勃勃的研究计划。谷歌在2013年收购了杰弗里·辛顿的创业公司,翌年又斥资超过5亿美元,买下英国的人工智能创业公司DeepMind,运用其技术开发出了AlphaGo。这些行动无不让众人惊叹,同时也成了媒体的焦点。它们改变了当代文化思潮,让我们意识到人类正站在一个新时代的边缘:在这个新时代,机器的能力将赋予人类更强大的能力,但也可能会大规模取代人力。
下期看点:深度学习的先驱吴恩达认为,人工智能类似于第二次工业革命中电力的发明,本身是一项突破性的技术,一旦被大幅采用,就能革新许多不同的产业。
新闻推荐
据新华社墨尔本1月16日电随着张择/公茂鑫16日在澳网赢球,这对中国男双组合首次在大满贯赛中晋级第二轮。而女双赛场也有...