想象一下你和朋友们出去喝酒,喝着喝着就脱离了掌控,拿出手机自拍,然后毫不犹豫地传到社交网站。这很正常,也令人尴尬。但YannLeCun想阻止这样肆无忌惮地行为,或者至少在人们做一些可能令他们后悔的事时,给予警告。他想在Facebook中建立一个智能助手,识别出令人尴尬照片。想像一下,它会对你说:“你确定想让你老板和你妈看到这个么?”
LeCun是纽约大学的研究员,机器学习方面的专家,还是Facebook人工智能研究实验室(FAIR)的负责人。
建立这样的工具,就要建立图像识别系统,分辨醉醺醺的你和清醒的你。利用最近流行的人工智能“深度学习”模式(由LeCun以及其他学者引入),Facebook已经能识别出分享到社交网络上照片中的人脸,方便你将脸跟人名对号入座。
进击的智能
Facebook实验室成立已有一年,它对世界上最大的社交网络的贡献不仅仅局限在某个方面。该团队研发的算法如今可以分析你的整个Facebook行为,识别出符合你口味的新闻内容;在你浏览重要内容时,很快分析全文,并自动给出中肯的评价。但是LeCun和他的团队仍不满足,希望人工智能系统能以更复杂的方式理解数据,从而为你指引你不曾想到的方向。
对某些人来说,这是一个痛苦的选择。他们不想让机器告诉他们应该做什么,不想让机器识别他们的脸,更不想他们的脸存储在某个远处的数据中心里。但对LeCun来说,FAIR做的是让你对自己的网络身份多些控制。他还设想,当一个你不认识的人在未得到允许就将你的照片晒到社交网络上后,Facebook会立即提醒你。
他和团队并不是在深度学习技术上孤军奋战。利用成百上千台电脑的录音资源,谷歌在自己的搜索引擎上测试深度学习,对你向手机发出的指令进行识别,并最终在社交网络上确定照片;微软利用该技术能对Skype电话进行语音翻译;Twitter和雅虎都相继推出了自己的产品。
这项技术对互联网巨擘们有着重大的意义。谷歌挖去了多伦多大学的GeoffHinton教授,他与LeCun等人创建了深度学习机制;百度最近签下了吴恩达,他曾在谷歌协助建立深度学习项目。自从LeCun去年被聘任过来负责FAIR,他还从Google偷走了一些人才。
语言的力量
深度学习并不是真正意义上的新技术。LeCun、Hinton等人受JohnPlatt的启发从上世纪80年代就开始探索基本原理。Platt在微软进行了长时间的研究,10年前微软采用类似的技术试图改进平板电脑的手写识别。Platt指出,伴随着计算机硬件的发展,互联网才能组织海量的数据帮助训练神经网络,这项技术最近才得以井喷式发展。
整个行业都在重新定义图像识别和语言识别。但就像谷歌,LeCun也有更多想法。他指出下一步的发展方向是自然语言的处理,让机器理解整个句子和段落的意思。
LeCun表示,短期内Facebook的目标是研发出能自动回复简单问题的系统。最近公司开发了一个小工具,提取《魔戒》的摘要后,就能回答相关的问题。这是对人为短时记忆的探索,这项工作被称为“周期性神经网络”,旨在改进翻译系统。这个神经网络就好比我们自己处理翻译时的大脑皮层。
完全的智能
LeCun表示,长期的目标是开发出类似智能数字助手的系统,能分析上传到Facebook上的所有东西。“你需要一个能真正理解内容,了解人,并能存储所有数据的机器”,他说道“这就是完全智能了。”
他们希望在未来的5-10年,Facebook能走的更远。LeCun表示下一步计划可能与虚拟现实OculusRift有关,这项提议Facebook在今年的早些时候就提出来了,并已经与Oculus团队进行了初步协商。
当然,还有些因素制约着智能领域的发展。Facebook还没有将智能技术与机器人技术结合在一起,但LeCun表示就学术研究而言他对此非常感兴趣,这自然是下一步计划。