院士:人工智能的魅力是“永远在路上”

对经济效益也有很大的贡献。目前来看,ai应用效果比较好的领域有三个,一是医疗保健,二是汽车,三是金融服务业。对经济效益也有很大的贡献。目前来看,ai应用效果比较好的领域有三个,一是医疗保健,二是汽车,三是金融服务业。

  不过,邬贺铨院士也同时指出,目前机器学习还有很多罪大恶极,一个诺贝尔奖经济学奖得主(judea pear)说“人工智能不过是统计学”,还是有很多罪大恶极的地方。对于人工智能下一步如何进化,邬贺铨院士引用清华大学张钹院士的观点说,我们要把感知和认知放到同一个空间里,不是简单用概率统计的理论,要用模糊级的理论来重新定义它。

  或者,发展群体智能。邬贺铨院士在演讲中表示,互联网已经是第50年了,50年的互联网到现在还保持互联网流量年增60%,这些增速也会对未来人工智能技术的发展有很大的影响。“人工智能会使得我们的生活更优美,或是走到我们的反面,这一切取决于人类自己。”邬贺铨说到,人工智能持久在路上,这也就是人工智能的魅力。(小羿)以下为邬贺铨院士演讲实录(网易智能做了不改动原意的整饬):

院士邬贺铨:人工智能的魅力是“持久在路上”

各位领导、各位专家早上好。我发言的题目是“接待人工智能的未来”。我们可以看看支柱人工智能发展的技术,比如cpu的芯片、存储器、光纤、移动通信、超算、大数据??用十年的时间来看,有些是60多倍,有些是成本两万倍下降,光纤通信10年100倍容量提升,移动通信10年1000倍的速率提升,超算能力1000倍的提升,算法我在这里没写,但等会儿会说到,大数据量约略是32倍的提升。

  这是前几年统计下来的网络重要设备年均性能改进的增速。互联网已经是第50年了,50年的互联网到现在还保持互联网流量年增60%,这些增速也会对未来人工智能技术的发展给予很大的影响。深度神经网络实际上是个分类器现在深度神经网络,就算你写本书告诉计算机什么是猫什么是狗,它也学不会,但如果像对待人类小孩的教学方式那样,感性地把一堆猫和狗的视频送到深度神经网络,它就会分类,分类间断中止后,如果照片视频上有标签,它就会知道分的这类是猫。

  如果篮子里有个小狗,放进去,它仍旧会分类为“狗”。所以深度神经网络实际上是个分类器,当你告诉它是什么,它就学会了。机器学习是深度神经网络的重要技术,从近10年里机器学习的论文里可以发现,现在机器学习的技术热点,可以看到神经网络和进化编程等计算密集型算法在机器学习研究中的优异表现。后来隔了一年,改进了alphago zero,换算成tpu,它只是alphago原有1/12(能耗),用1/12的能耗跟alphago下棋,100比0,当时alphago还要搜集所有的围棋棋谱,然后训练三个月,alphagozero只需要了解围棋的规则,两个alphagozero互相对应,能把所有人类他国走过的棋谱都走完,它就能征服了。

  所以优化算法、改进硬件,包括gpu替换cpu(提高了三倍),tpu替换gpu(提高了15到30倍)。最近不单alphago zero围棋天下无敌,而且通过自学2个小时,还击败了日本的将棋(有点像中国的象棋),自学4个小时,把国际象棋也全部打赢了。人工智能能做的事情有太多在医学上,刚刚过去的三个月,谷歌在机器学习又开发了alpha fold,alpha go的折叠,所谓折叠是来预计蛋白质结构的,在蛋白质结构预计的国际竞赛里,打败了所有由人构成的各种团队,这有什么意义?如果能解释蛋白质的结构,我们的很多疾病(包括癌症)可能就会找到解决办法。所以现在很多人工智能用在医学上开发药物,美国人工智能能比医生提早六年诊断出阿兹海默病,医疗人工智能的器械也起先投入商用了。

  除此之外我们看一看蛋白质折叠结构,我们可以通过人工智能将它解释出来。我们知道门捷列夫开发元素周期表用了很长时间,现在假设我们不知道元素周期表,利用人工智能程序,几个小时就可以把元素周期表重新定义出来。也就是说,人工智能确实能做好多事。包括人脸识别,中国上海依图科技的人脸识别率在万分之一,误失率前提下可以通过98%,银行柜台人员用肉眼比对,误差一般在1%,也就是说机器准确性是超过人的眼睛的。

  天然,动态三维活体检测更难,下面的图是小布什的原相,右边的小部什头像和原图一样,但嘴型和上图的胖子嘴型一样,我们听不出胖子讲什么,但小布什可以通过口形恢复出他讲话的声音,读懂唇语。我们知道张学友在好几场演唱会上抓到了逃犯,这不是原因张学友,而是演唱会门口的人脸识别门口。所以张学友说“抓逃犯是我的正业,唱歌只是副业”。

  机器视觉应用于什么?这是一个肺部ct照片,大家可以从中发现有他国长瘤子、有他国癌症,但ct可以扫描出几百张图片,很麻烦。我们通过人工智能把这些ct照片还原成一个肺,看看有他国纤维化,再看看肺周边的器官怎么样。语音识别可以用于医学,还有图像识别,可以重修三维影像,比如医学教育,包括在增长医疗手术的辅导可以起到很好的作用。

  在产业上,清华和英业达合作(做影像电路板的),影像电路板很复杂,可以看看该连的线是不是连了,不该连的线是不是没连,人的肉眼很容易错检,但利用机器视觉就可以发觉人的肉眼没法儿发现的问题,每年的经济效益9000万。看好ai在医疗保健、汽车和金融服务的应用,但挑战很大ai指数比较高的应用效果比较好的领域是:一是医疗保健,二是汽车,三是金融服务业。

  主动驾驶在简单路况中是好的,复杂路况就很难,原因行人和司机不见到都遵照交通规则,很难用训练的办法掌握,还需要驾驶员的经验和知识,而且人类犯错是偶尔的,机器一旦犯错可能就是系统性的。人工智能可以检测肿瘤,但医院还不敢这么用,原因人工智能本身可以告诉你应该做什么,但它不会告诉你为什么,比如人工智能诊断一个病人,最终得出结论“锯掉一条腿”,但不告诉你为什么,那医院敢锯掉腿吗?目前机器学习还有很多罪大恶极,图灵奖的获奖者说,目前机器学习只是曲线的拟合,一个诺贝尔奖经济学奖得主(judea pear)说“人工智能不过是统计学”,也就是说目前还是有很多不够的地方。刚才我用的两张图映射的猫和狗的区别有个曲线,但只要拟合的地方稍微错一点,可能就会发生错误。比如原来是熊猫,在照片上加上一些噪音,机器就可能识别成长臂猿,所以人工智能识别目前来讲还是比较娇气的。大家看这张图,有人看是顺时针转,有人看是逆时针转,哪怕是同一个人,一会儿看着是顺时针转,眨眨眼睛却变成了逆时针转,究竟是顺还是逆?其实只是左腿在前还是右腿在前的问题,是你的错觉。

  为什么会出现这个错觉?原因它恰好处于人工智能辨识(包括人辨识)的分界线,这时就可能发生误导。比如这个图里的圆圈,大家都觉得它是滚动的、是圆的,可是真的是这样吗?每个球都这样走吗?不一定,我们可以看看。实际上每个球走的都是直线,所以人工智能的模型是会被误导的。这张图中最终一个打问号的地方应该放(几个数字),人很容易看出来应该放哪个,原因第一行232,第二行343,第三行应该是454,可是人工智能就很难看出来,原因人工智能要获得人类常识不是那么容易的。

  人工智能的进化与对就业的冲击天然,神经网络现在还在演进,关键是怎样选择准确框架以及训练,清华大学的张钹院士说我们要把感知和认知放到同一个空间里,不是简单用概率统计的理论,要用模糊级的理论来重新定义它,否则我们没办法跟机器人交流,机器人之间也没办法交流。机器学习着重于通过数据了解环境,而人类能够同时洞悉不同的环境,群体学习是人类与生俱来的本领,而电脑是不具备的。

  我曾经跟一个搞人工智能的公司说,识别语音、下围棋都不算什么,能不能构造11人的机器人足球队,什么时候踢赢皇马了,那你就算厉害了,原因11人的机器人足球队是要群体活动的。刚才谈到就业,实际上人工智能确实会取代很多现在的就业,49%的劳动人口可能会被取代,但一半以上的人是不会被取代的,原因人工智能他国情感,有情感创作的文艺工作是不能被取代的,人工智能不能取代文艺,要由人来做。

  美国高德纳咨询公司以及世界经济论坛发布的《2018未来就业》报告中都说,实际上取代了一部分工作,但会新增一些工作岗位。人工智能会带来数字鸿沟,发达国家、先进企业,还会拉大社会贫富悬殊,高智能岗位会添补,一般劳动岗位会减少,主动驾驶出了问题是谁的责任?机器人创作的小说、诗歌是否享有相应的知识产权?有法律道德的问题,还有安全问题,如果人工智能杀人了怎么办?最终,总书记提到,要加快发展新一代人工智能,是我们赢得全球科技竞争主动权的紧要抓略抓手。

  清华大学张钹院士说,我们现在正在通往ai的路上,现在走得并不远,在出发点附近,但人工智能持久在路上,大家要有思想准备,而这也就是人工智能的魅力。人工智能会使得我们的生活更优美,或是走到我们的反面,这一切取决于人类自己。谢谢。(完)搜索复制