贾伟中科院合肥 发表于 2015-7-7 12:50:38

强势围观一线大牛关于人工智能和深度学习的讨论

强势围观一线大牛关于人工智能和深度学习的讨论

2015-06-29 数盟


主持人雷鸣:首先,我们现在人工智能到底在什么阶段?从科研来看,从商业化来看?比如自然语言对话,图像识别,推荐系统,机器人等。请几位都从自己的角度回答一下。杨克:very early stage, far far from what you see in movies,but enough progress to make useful products and sometimes impressive ones。余凯:推荐系统目前已经广泛商业化,在商品推荐,个性化广告等,但是推荐系统虽然在互联网公司广泛运用,但是似乎很难依靠推荐系统做出一个独立的服务商业模式,这点和搜索以及广告不同。图像识别和语音识别最近的进展,主要得益于深度学习,目前语音识别在从90%向97%~98%冲刺。而图像识别,要相对滞后,但是最近几年发展迅速,将会看到一些成熟的商业应用。李飞飞:从历史看AI的基础科学走过了两个阶段:expert system 的研究发展和应用,和machine learning的研究发展和应用(虽然后者的潜力还远没开发完)。每一次基础科研的进步,一定会带动科技工程和产业的发展。我认为我们现在看到的,就是机器学习这三十年积累下来的果实。从视觉来看,视觉分几个层面:perception, cognition, and action. perception主要是指的基本识别,如shape, color, motion, objects, etc. 在这方面,因为机器学习的进步,尤其是软硬件的飞跃,我们开始看到接近应用层面的结果了,虽然object识别还有待提高。但是,我们离cognition还很远。沙飞:人工智能近来的发展确实振奋人心,这主要是得益基于大数据的机器学习进展。一些well-defined benchmark问题得到很大的进展。李飞飞:这里指的cognition,包括了类似人类的知识acquisition, abstraction and creation的能力,分析能力,情感和情绪能力,推理能力,等等。雷鸣:说一下当前最热的人脸识别,现在识别准确率真的超过人了吗?如果没有,那么在最近的一段时间里,会超过吗?漆远:但是同时一些关键问题,比如逻辑和知识的表达,仍未很好地解决。沙飞:但是有很多问题,还不能很好地归结在现有的机器学习的框架下。余凯:关于机器人,我认为大的发展刚刚开始,目前在perception (感知), control方面会有很大的进展,但是cognition(认知)等方面,涉及高层语义以及世界知识,还有巨大距离。所以,如果说现在机器人,想实现阿猫阿狗等宠物的智能水平,我觉得是有现实意义的,但是离人的智能,还不现实。所以在考虑商业模式的的时候,这点要考虑。李飞飞:特定情况下超过了人,或者说普通人。这也不奇怪呀,人的基本计算能力很差劲的。杨克:我看过一段Andrew N的视频。他提到现在的深度学习有很大的发展,因为有很好的Rocket Engine (faster computes and esp. GPUs) and Rocket Fuel (big data)。 我觉得很有道理。人脸识别的确机器可以比人做得更好。我自己的人脸识别能力就非常弱。沙飞:我同意Andrew的说法,但想补充一点:这些问题解决好的有well-specified performance metric and optimization criteria, so they will benefit more from big data and fast computation.漆远:哈哈,人脸识别上机器可能更好。但在变形物体上人一般比机器强。李飞飞:AI的各个分支会在不久的将来在PERCEPTION方面大大超过普通人。但是就像今天的人造飞机比小鸟飞的又快又高,到现在也做不到小鸟的灵活、起落和其他各种飞行能力。沙飞:IBM Research 在做语音识别时,很早就提出了superhuman recognition (of speech).余凯:人脸识别的能力,应该是和人相近,或者在有的方面超过人了。比如关于对于身份证件照的人脸验证,在误认率为0.01%时,拒识率可以达到10%,对于百万级别的人脸库,这个能力已经超过人类。人类的人脸识别水平,没有我们想象的高。大家对于高中同年级的同学,可能除了同班的,大部分都记不住人脸,尽管在校园里打过多次照面。余凯:人脸识别的能力,应该是和人相近,或者在有的方面超过人了。比如关于对于身份证件照的人脸验证,在误认率为0.01%时,拒识率可以达到10%,对于百万级别的人脸库,这个能力已经超过人类。人类的人脸识别水平,没有我们想象的高。大家对于高中同年级的同学,可能除了同班的,大部分都记不住人脸,尽管在校园里打过多次照面。余凯:是的,飞飞说的有道理杨克:完全同意飞飞的观点。目前的人工智能可以在某些特定的应用上超过人类。但是这和造出一个像电影里面的机器人还是有很大的差距。雷鸣:就这个问题,我们先聊到这里?漆远:关于沙飞说的现有框架的有限性,一个例子是目前人工智能系统在因果关系上的推理能力也很有限。雷鸣:我们接着谈一下当前在人工智能领域最火的名词“深度学习”。当前特别火的深度学习,为什么这么火,能够解决什么问题,有什么优势?有什么局限吗?余凯:深度学习的基本思想和方法,其实在80年代末就提出。今天之所以受到重视,更多的是因为大数据和计算能力,以及互联网应用需求的拉动。余凯:目前深度学习的巨大优势,主要体现在感知,比如语音识别,图像识别。沙飞:Alan的例子很好 可能也是深度学习现在还没解决好的一个问题: causality inference, does not necessarily depend on the amount of data one needs to see.李飞飞:深度学习是80年代的一支机器学习神经网络的新名字。数学框架没有变得。但是硬件和数据的支持使得这种有high capacity的计算结构发挥的优势。漆远:能够解决什么问题: 语音和图像是深度学习的经典应用。 在NLP上大家也看到希望。杨克:从数学上讲,所谓机器学习就是用一堆的数据去fit在一个model in a sparse model space. if your model space is bigger, you can potentially find a better fit.余凯:深度学习在最近针对序列数据,比如使用RNN, LSTM, 有非常激动人心的发展,这些进展很可能推动语音识别和自然语言处理向前大踏步前进。李飞飞:深度学习在工业和产业界的大量应用是machine learning既regression和support vector machine之后的又一激动人心的应用。在perception的问题上会让我们看到很多有用的产品。漆远:或者客服应用里的Q&A上。沙飞:@Ke: 问题是how to prevent overfitting. 深度学习主要是通过大数据来实现。李飞飞:但是想大家所说的,今天的深度学习是“浅层思考”, Deep Learning but Shallow Reasoning。杨克:深度学习无非是把这个model space增大了很多 — RNNs are proven to be Turing complete. 所以他的potential很大。传统上来大家不知道有什么好的方法来train.但是现在的rocket fuel and rocket engine makes it possible漆远:@沙飞,是的,causal inference has been there for a while but largely ignored by machine learning and AI people. I don’t see how deep learning can help here.余凯:深度学习还有一个激动人心的应用,就是learning to control. 我认为机器人的控制,会因为DNN reinforcement learnign的方法而发生改变。现在的机器人跳舞,只是邯郸学步,很笨,很傻。基于深度学习的机器人,会听着音乐节奏,自己跳舞。雷鸣:听起来深度学习是当前最有突破点的技术,有很多可能。除了深度学习之外,最近还有什么在机器学习领域令人振奋的点吗。杨克:从数学上看,深度学习是机器学习的非常自然的下一步: you move to a more complicated model with bigger model space so that you can fit better without outfitting漆远:是的,learning to control echoes neural dynamic programming余凯:所以,在从感知到控制,DNN是rocket engine. 在认知层面,DNN刚开始,但我相信是正确方向。余凯:从数学上看,深度学习是机器学习的非常自然的下一步: — agree Ke Yang李飞飞:深度学习急需解决的一个问题是knowledge representation。不能什么都靠大数据,即使是shallow的transfer learning也解决不了这个问题。漆远:and has tons of potential applications.沙飞:agree with Fei-fei杨克:在google有人开玩笑说 60% of the time, google brain works all the time.我觉得很有道理。深度学习在一些领域非常成功,但并不是万能药。漆远:我觉得深度学习是机器学习的一个重要方向,但未必是唯一方向。余凯:关于飞飞提到的knowlege representation, 需要顺着目前深度学习distributed representation的思路进一步发展,但是我认为需要有新的创新漆远:agree with Feifei沙飞:Let me give an example of “shallow reasoning”: I am traveling in Germany. I do not speak German but I need to take subways to go between places.余凯:just to make the discussion more interesting — 我认为深度学习是机器学习的唯一方向沙飞:An important “skill” I need to do is to infer from subway announcements of arriving stations whether I have reached the right destination.雷鸣:@余凯 自己找靶子啊余凯:哈哈,我3年前是这么认为的,现在更加坚定了雷鸣:各位同意余凯的观点吗?李飞飞:@余凯 主要是现在什么都叫深度学习,所以当然是“所有方向就是唯一方向”嘛漆远:哈哈,now it is more interesting http://mmbiz.qpic.cn/mmbiz/ymzg67DoLHKY0DuJ82b9qFZ45ia3iaHTDfMkEahDu6iaLFTLCr8pWBaVlTJLKT5ukhtAeoy0FVWmjy9Fk4Gk1ac8Q/640?wx_fmt=png&tp=webp&wxfrom=5 我爱余凯但更爱真理沙飞:This requires me to figure out (1) how to determine the prounancing of the destinations in German (2) how to segment the sounds in a language that I do not know, in a noisy environment (3) how to match robustly. All those require “deep reasoning”杨克:我觉得作研究的人也喜欢跟风。现在深度学习热了,什么人都在作深度学习。所以放眼望过去,深度学习真的是唯一的方向 — for now.余凯: 主要是现在什么都叫深度学习,所以当然是“所有方向就是唯一方向”嘛 —李飞飞:但是我觉得讨论所谓的深度学习是不是“唯一方向”意义不大,尤其是如果这只是一个文字游戏的话。雷鸣:我虽然相对各位外行一些,不过确实满眼都是“深度学习”沙飞:取决于怎么定义深度学习 。杨克;但是我相信以后会有更多的理论和技术出来,那时候他们还叫不叫深度学习,真的只是一个文字游戏余凯:在三年前,或者六年前,其实不是这样的。90%的机器学者是怀疑的。漆远:要知道机器学习领域像是时装界,最时髦的词汇一直在变。李飞飞:深度学习的思路结合机器学习这三、四十年的很多精髓:optimization theory, hierarchical architecture, and supervised learning. 如果这些叫深度学习的话,也就是文字游戏而已。漆远:是的,这个争论可能更多的是文字游戏。余凯:深度学习其实本身的确是一张方法论,一种框架,不是几个具体的模型。雷鸣:哈哈,此事我们讨论到这里?余凯:其实不是文字游戏。我举一点: end-to-end training, 这是深度学习带来的思想。沙飞:@余凯 那也不是新的 -- LeCun et al’s gradient-based modular learning system has been around for a long while.雷鸣:不过看来从广义角度来讲,深度学习当前确实代表一个大方向。余凯:但是我同意飞飞讲的,深度学习的确吸取了几十年来机器学习的很多精髓, 比如: structured output, latent-variable models余凯:沙飞, LeCun恰恰是一直以来深度学习思想的鼓吹者。雷鸣:我们转向稍微实用一些的问题。。。沙飞:That is why he says “What is wrong with deep learning?” haha漆远:深度学习也不能刻画uncertainty,在金融应用中往往不确定性和风险联系在一起。余凯;end-to-end training对深度学习hard core的人来讲,是一种宗教信仰漆远:这是一个实用的例子。雷鸣;最后,从未来5年来看,大家可以看到在什么领域或则方面,人工智能会进入人们的生活,哪些产品或者服务会大有机会,比如智能家居?自动驾驶?智能监控?机器人?,在更宏观的领域,会对医疗,金融,教育,工业等,带来什么深远的影响。余凯:深度学习也不能刻画uncertainty — 当然可以,你可以给weights加上prior雷鸣:注意关键词:5年,实际影响到人的生活李飞飞:其实end to end是很多machine learning algorithm的理念,但是目前确实深度学习应用的最好!沙飞:事实上,uncertainty quantification is a big problem for just about any learning models余凯:yes李飞飞:只要有数据的地方就会有数据分析,只要有数据分析的需要就有人工智能。雷鸣:其实是给企业家,投资者,创业者看的,从我们专家的眼里,看到的未来几年的热工智能产业机会在哪里?余凯:只要有数据的地方就会有数据分析,只要有数据分析的需要就有人工智能 — 是的漆远:同意目前深度学习实用性最好,更general 的深度学习观念可以更广的实用。余凯:更general 的深度学习观念可以更广的实用 — 是的。漆远:不过,对实用的深度学习,加了prior 就没法算了。雷鸣:我们的社会正转型为数据时代,那么人工智能就是数据时代的王者了漆远:所以,uncertainty还是搞不定的,在大规模实用系统里。余凯:我们不应该过多的看过去,深度学习已经做了什么,更应该看未来,我觉得漆远说的对,更general的深度学习可以更广泛更实用。其实刚才几位也说到了,其实叫不叫深度学习,并不重要,重要的是什么思想。漆远:完全同意杨克:人工智能早已进入你的生活了。语音识别又是一根很好的例子。搜索引擎里也用到很多人工智能的东西。这一方面百度好像还走在谷歌前面。现代的汽车一般都有几十个电脑--都不需要自动驾驶车。李飞飞:但是广大老百姓心目中的人工智能是带有情感、情绪和像人一样的灵活分析纠错和行动能力的东东。雷鸣:@Ke Yang 同意。但看起来还是早期。我觉得现在的人工智能应用,跟94-96年互联网那样余凯:我觉得,在线教育,是深度学习大规模应用的一个垂直领域杨克:实话实说。其是谷歌里面还是有很多深度学习的应用。很多我们也没有说。但是我们总体会慢一些事真的。雷鸣:非常早期,一切都有可能,但是都没有真正大规模的用起来,到用户非常满意的程度李飞飞:但是人工智能的产业应用还是更低层,更实际。余凯:实话实说,百度过去在机器学习方面的积累少,所以可以更大胆的应用深度学习,这有历史原因。我也爱阿里的alan qi, 哈哈杨克:我们的社会正转型为数据时代,那么人工智能就是数据时代的王者了 -- 这句话我不一定赞同。就想说大家都用电脑了,做CPU才是王道。雷鸣:任何一个事情都需要多方面的积累,但是CPU是关键的一环。余凯:语音识别,图像识别,自然语音理解,我觉得会持续推进。这三个领域,应该会诞生3个500亿美金市值的公司,在今后的10年里。大家拭目以待杨克:我觉得人工智能会慢慢变成一种commodity,所有人都会用到。就像多核处理器一样,原来觉得很玄妙的东东,现在手机里都变的士。关键是要找到好的killer app漆远:同意杨克的说法,不过在人工智能变成一种commodity前,确实会很可能有人工智能公司的rising雷鸣:我同意杨克的观点,技术本身会慢慢变成不是最关键的,关键的是使用这些技术,真正解决实际问题余凯:教育,金融,医疗,交通,智能家居,娱乐,等领域,都会有大的机会。雷鸣:教育,金融,医疗,交通,智能家居,娱乐,等领域,都会有大的机会。漆远:5年可能太快了吧。李飞飞:首先从辅助诊断开始。雷鸣:到达到医生水平需要多久?你觉得?5年,10年雷鸣:@余凯,确实,现在机器学习工程师确实一人难求啊!各位搞这个方面的,可是生逢其时啊!李飞飞:说实话,要是数据不是问题,我认为今天的人工智能已经能在80%的病症方面达到普通医生水平。漆远:这得看是哪一个科目的医生雷鸣:哈哈,看来医疗这个方面,未来大有可为啊。教育方面呢?大家如何看?余凯:医疗是人工智能的大战场雷鸣:人工智能如何提升教育,老师会被替代吗?余凯:不会,再好的老师,也需要助教不是雷鸣:@余凯,那就是人工智能做好老师和家长的教学助理?对吧余凯:是的,我觉得是沙飞:more precisely, “data-driven personalized education monitoring/tutoring systems”雷鸣:机器人方向呢?你们觉得服务机器人未来5年会大行其道吗?李飞飞:传教,授业,解惑。人工智能可以做一小部分。雷鸣:阿里巴巴也投资了漆远:follow 前面的话题:大部分人大部分时间得的病都是小病,所以人工智能在医疗上可能会很有实际用处的。漆远:在中国,服务机器人没准也很有用处的;银行的服务窗前队伍太长。余凯:比如Nest的平台,本身就在朝着智能机器人的方向走,虽然不是人形机器人雷鸣:那就是智能硬件,智能家居这个方向?传统的东西,更有智慧李飞飞:这些家用的物联网上的东西,会最早应用到底层的人工智能,形成智能物联网。杨克:人工智能会从最琐碎的事情开始代替人。现在的电梯都是无人的。现在的车的cruise control越来越好,都是典型雷鸣:各位觉得,在人工智能方向,创业公司和大公司相比有什么优势劣势?小公司有机会翻盘吗?杨克:所以我觉得医疗上会是从边缘的地方开始,比如说 triage, screening, etc. 取代医生还需要一段时间李飞飞:纵观人类上下五千年,小公司永远有机会翻盘,然后变成大公司被淘汰漆远:大公司有机器有技术有数据,但可能少了些craziness和不同的角度。漆远:还少了些灵活度。大象跳舞不太容易的。所以小公司总有机会。但大公司,也许尤其在中国,确实是有天时地利人和的优势。杨克:同意。余凯同学刚刚离开百度,所以我可以猜到他是怎么想的。我前天刚刚从谷歌离职,也要加入一家小公司。smaller companies distrupt bigger ones余凯:大公司会在自己的核心领域不断加力,但是在核心领域之外有所作为,会比较难。雷鸣:要么对话部分先到这里,我们进入群友提问时间,如何?大家有什么问题希望和嘉宾探讨,请开始提出。
关于我们 ID:DataScientistUnion
数盟网站:www.dataunion.org
数盟微博:@数盟社区
数盟微信:DataScientistUnion
数盟【大数据群】272089418
数盟【数据可视化群】 179287077
数盟【数据分析群】 174306879
(长按可关注)http://mmbiz.qpic.cn/mmbiz/ymzg67DoLHLYHiaZDYJrcy6c6aRn46WCR2u3baCY7FqiaFfpqiaibu3q9JvKyrrDiaFn8fogoPPdK1bdOfgMvdXGoicQ/0?wxfmt=jpeg&tp=webp&wxfrom=5


王安志川大 发表于 2015-7-7 13:47:06

贾老师,这是史上最强论战第二弹,请问史上最强论战第一弹是是什么?有没有链接?想去看看,谢谢

贾伟中科院合肥 发表于 2015-7-7 13:56:53

王安志川大 发表于 2015-7-7 13:47
贾老师,这是史上最强论战第二弹,请问史上最强论战第一弹是是什么?有没有链接?想去看看,谢谢 ...

题目是转载的,易造成误解,已经修改。
页: [1]
查看完整版本: 强势围观一线大牛关于人工智能和深度学习的讨论