强势围观一线大牛关于人工智能和深度学习的讨论

贾伟中科院合肥 · 发表于 2015-7-7 12:50:38

强势围观一线大牛关于人工智能和深度学习的讨论

2015-06-29 数盟

主持人雷鸣：首先，我们现在人工智能到底在什么阶段？从科研来看，从商业化来看？比如自然语言对话，图像识别，推荐系统，机器人等。请几位都从自己的角度回答一下。

杨克：very early stage， far far from what you see in movies，but enough progress to make useful products and sometimes impressive ones。

余凯：推荐系统目前已经广泛商业化，在商品推荐，个性化广告等，但是推荐系统虽然在互联网公司广泛运用，但是似乎很难依靠推荐系统做出一个独立的服务商业模式，这点和搜索以及广告不同。图像识别和语音识别最近的进展，主要得益于深度学习，目前语音识别在从90%向97%~98%冲刺。而图像识别，要相对滞后，但是最近几年发展迅速，将会看到一些成熟的商业应用。

李飞飞：从历史看AI的基础科学走过了两个阶段：expert system 的研究发展和应用，和machine learning的研究发展和应用（虽然后者的潜力还远没开发完）。每一次基础科研的进步，一定会带动科技工程和产业的发展。我认为我们现在看到的，就是机器学习这三十年积累下来的果实。从视觉来看，视觉分几个层面：perception, cognition, and action. perception主要是指的基本识别，如shape, color, motion, objects, etc. 在这方面，因为机器学习的进步，尤其是软硬件的飞跃，我们开始看到接近应用层面的结果了，虽然object识别还有待提高。但是，我们离cognition还很远。

沙飞：人工智能近来的发展确实振奋人心，这主要是得益基于大数据的机器学习进展。一些well-defined benchmark问题得到很大的进展。

李飞飞：这里指的cognition,包括了类似人类的知识acquisition, abstraction and creation的能力，分析能力，情感和情绪能力，推理能力，等等。

雷鸣：说一下当前最热的人脸识别，现在识别准确率真的超过人了吗？如果没有，那么在最近的一段时间里，会超过吗？

漆远：但是同时一些关键问题，比如逻辑和知识的表达，仍未很好地解决。

沙飞：但是有很多问题，还不能很好地归结在现有的机器学习的框架下。

余凯：关于机器人，我认为大的发展刚刚开始，目前在perception （感知）, control方面会有很大的进展，但是cognition（认知）等方面，涉及高层语义以及世界知识，还有巨大距离。所以，如果说现在机器人，想实现阿猫阿狗等宠物的智能水平，我觉得是有现实意义的，但是离人的智能，还不现实。所以在考虑商业模式的的时候，这点要考虑。

李飞飞：特定情况下超过了人，或者说普通人。这也不奇怪呀，人的基本计算能力很差劲的。

杨克：我看过一段Andrew N的视频。他提到现在的深度学习有很大的发展，因为有很好的Rocket Engine (faster computes and esp. GPUs) and Rocket Fuel (big data)。我觉得很有道理。人脸识别的确机器可以比人做得更好。我自己的人脸识别能力就非常弱。

沙飞：我同意Andrew的说法，但想补充一点：这些问题解决好的有well-specified performance metric and optimization criteria, so they will benefit more from big data and fast computation.

漆远：哈哈，人脸识别上机器可能更好。但在变形物体上人一般比机器强。

李飞飞：AI的各个分支会在不久的将来在PERCEPTION方面大大超过普通人。但是就像今天的人造飞机比小鸟飞的又快又高，到现在也做不到小鸟的灵活、起落和其他各种飞行能力。

沙飞：IBM Research 在做语音识别时，很早就提出了superhuman recognition (of speech).

余凯：人脸识别的能力，应该是和人相近，或者在有的方面超过人了。比如关于对于身份证件照的人脸验证，在误认率为0.01%时，拒识率可以达到10%，对于百万级别的人脸库，这个能力已经超过人类。人类的人脸识别水平，没有我们想象的高。大家对于高中同年级的同学，可能除了同班的，大部分都记不住人脸，尽管在校园里打过多次照面。

余凯：是的，飞飞说的有道理

杨克：完全同意飞飞的观点。目前的人工智能可以在某些特定的应用上超过人类。但是这和造出一个像电影里面的机器人还是有很大的差距。

雷鸣：就这个问题，我们先聊到这里？

漆远：关于沙飞说的现有框架的有限性，一个例子是目前人工智能系统在因果关系上的推理能力也很有限。

雷鸣：我们接着谈一下当前在人工智能领域最火的名词“深度学习”。当前特别火的深度学习，为什么这么火，能够解决什么问题，有什么优势？有什么局限吗？

余凯：深度学习的基本思想和方法，其实在80年代末就提出。今天之所以受到重视，更多的是因为大数据和计算能力，以及互联网应用需求的拉动。

余凯：目前深度学习的巨大优势，主要体现在感知，比如语音识别，图像识别。

沙飞：Alan的例子很好可能也是深度学习现在还没解决好的一个问题: causality inference, does not necessarily depend on the amount of data one needs to see.

李飞飞：深度学习是80年代的一支机器学习神经网络的新名字。数学框架没有变得。但是硬件和数据的支持使得这种有high capacity的计算结构发挥的优势。

漆远：能够解决什么问题：语音和图像是深度学习的经典应用。在NLP上大家也看到希望。

杨克：从数学上讲，所谓机器学习就是用一堆的数据去fit在一个model in a sparse model space. if your model space is bigger, you can potentially find a better fit.

余凯：深度学习在最近针对序列数据，比如使用RNN, LSTM, 有非常激动人心的发展，这些进展很可能推动语音识别和自然语言处理向前大踏步前进。

李飞飞：深度学习在工业和产业界的大量应用是machine learning既regression和support vector machine之后的又一激动人心的应用。在perception的问题上会让我们看到很多有用的产品。

漆远：或者客服应用里的Q&A上。

沙飞：@Ke: 问题是how to prevent overfitting. 深度学习主要是通过大数据来实现。

李飞飞：但是想大家所说的，今天的深度学习是“浅层思考”, Deep Learning but Shallow Reasoning。

杨克：深度学习无非是把这个model space增大了很多 — RNNs are proven to be Turing complete. 所以他的potential很大。传统上来大家不知道有什么好的方法来train.但是现在的rocket fuel and rocket engine makes it possible

漆远：@沙飞，是的，causal inference has been there for a while but largely ignored by machine learning and AI people. I don’t see how deep learning can help here.

余凯：深度学习还有一个激动人心的应用，就是learning to control. 我认为机器人的控制，会因为DNN reinforcement learnign的方法而发生改变。现在的机器人跳舞，只是邯郸学步，很笨，很傻。基于深度学习的机器人，会听着音乐节奏，自己跳舞。

雷鸣：听起来深度学习是当前最有突破点的技术，有很多可能。除了深度学习之外，最近还有什么在机器学习领域令人振奋的点吗。

杨克：从数学上看，深度学习是机器学习的非常自然的下一步: you move to a more complicated model with bigger model space so that you can fit better without outfitting

漆远：是的，learning to control echoes neural dynamic programming

余凯：所以，在从感知到控制，DNN是rocket engine. 在认知层面，DNN刚开始，但我相信是正确方向。

余凯：从数学上看，深度学习是机器学习的非常自然的下一步: — agree Ke Yang

李飞飞：深度学习急需解决的一个问题是knowledge representation。不能什么都靠大数据，即使是shallow的transfer learning也解决不了这个问题。

漆远：and has tons of potential applications.

沙飞：agree with Fei-fei

杨克：在google有人开玩笑说 60% of the time, google brain works all the time.我觉得很有道理。深度学习在一些领域非常成功，但并不是万能药。

漆远：我觉得深度学习是机器学习的一个重要方向，但未必是唯一方向。

余凯：关于飞飞提到的knowlege representation, 需要顺着目前深度学习distributed representation的思路进一步发展，但是我认为需要有新的创新

漆远：agree with Feifei

沙飞：Let me give an example of “shallow reasoning”: I am traveling in Germany. I do not speak German but I need to take subways to go between places.

余凯：just to make the discussion more interesting — 我认为深度学习是机器学习的唯一方向

沙飞：An important “skill” I need to do is to infer from subway announcements of arriving stations whether I have reached the right destination.

雷鸣：@余凯自己找靶子啊

余凯：哈哈，我3年前是这么认为的，现在更加坚定了

雷鸣：各位同意余凯的观点吗？

李飞飞：@余凯主要是现在什么都叫深度学习，所以当然是“所有方向就是唯一方向”嘛

漆远：哈哈，now it is more interesting

我爱余凯但更爱真理

沙飞：This requires me to figure out (1) how to determine the prounancing of the destinations in German (2) how to segment the sounds in a language that I do not know, in a noisy environment (3) how to match robustly. All those require “deep reasoning”

杨克：我觉得作研究的人也喜欢跟风。现在深度学习热了，什么人都在作深度学习。所以放眼望过去，深度学习真的是唯一的方向 — for now.

余凯：主要是现在什么都叫深度学习，所以当然是“所有方向就是唯一方向”嘛 —

李飞飞：但是我觉得讨论所谓的深度学习是不是“唯一方向”意义不大，尤其是如果这只是一个文字游戏的话。

雷鸣：我虽然相对各位外行一些，不过确实满眼都是“深度学习”

沙飞：取决于怎么定义深度学习。

杨克；但是我相信以后会有更多的理论和技术出来，那时候他们还叫不叫深度学习，真的只是一个文字游戏

余凯：在三年前，或者六年前，其实不是这样的。90%的机器学者是怀疑的。

漆远：要知道机器学习领域像是时装界，最时髦的词汇一直在变。

李飞飞：深度学习的思路结合机器学习这三、四十年的很多精髓：optimization theory, hierarchical architecture, and supervised learning. 如果这些叫深度学习的话，也就是文字游戏而已。

漆远：是的，这个争论可能更多的是文字游戏。

余凯：深度学习其实本身的确是一张方法论，一种框架，不是几个具体的模型。

雷鸣：哈哈，此事我们讨论到这里？

余凯：其实不是文字游戏。我举一点： end-to-end training, 这是深度学习带来的思想。

沙飞：@余凯那也不是新的－－ LeCun et al’s gradient-based modular learning system has been around for a long while.

雷鸣：不过看来从广义角度来讲，深度学习当前确实代表一个大方向。

余凯：但是我同意飞飞讲的，深度学习的确吸取了几十年来机器学习的很多精髓，比如: structured output, latent-variable models

余凯：沙飞， LeCun恰恰是一直以来深度学习思想的鼓吹者。

雷鸣：我们转向稍微实用一些的问题。。。

沙飞：That is why he says “What is wrong with deep learning?” haha

漆远：深度学习也不能刻画uncertainty,在金融应用中往往不确定性和风险联系在一起。

余凯；end-to-end training对深度学习hard core的人来讲，是一种宗教信仰

漆远：这是一个实用的例子。

雷鸣；最后，从未来5年来看，大家可以看到在什么领域或则方面，人工智能会进入人们的生活，哪些产品或者服务会大有机会，比如智能家居？自动驾驶？智能监控？机器人？，在更宏观的领域，会对医疗，金融，教育，工业等，带来什么深远的影响。

余凯：深度学习也不能刻画uncertainty — 当然可以，你可以给weights加上prior

雷鸣：注意关键词：5年，实际影响到人的生活

李飞飞：其实end to end是很多machine learning algorithm的理念，但是目前确实深度学习应用的最好！

沙飞：事实上，uncertainty quantification is a big problem for just about any learning models

余凯：yes

李飞飞：只要有数据的地方就会有数据分析，只要有数据分析的需要就有人工智能。

雷鸣：其实是给企业家，投资者，创业者看的，从我们专家的眼里，看到的未来几年的热工智能产业机会在哪里？

余凯：只要有数据的地方就会有数据分析，只要有数据分析的需要就有人工智能 — 是的

漆远：同意目前深度学习实用性最好，更general 的深度学习观念可以更广的实用。

余凯：更general 的深度学习观念可以更广的实用 — 是的。

漆远：不过，对实用的深度学习，加了prior 就没法算了。

雷鸣：我们的社会正转型为数据时代，那么人工智能就是数据时代的王者了

漆远：所以，uncertainty还是搞不定的，在大规模实用系统里。

余凯：我们不应该过多的看过去，深度学习已经做了什么，更应该看未来，我觉得漆远说的对，更general的深度学习可以更广泛更实用。其实刚才几位也说到了，其实叫不叫深度学习，并不重要，重要的是什么思想。

漆远：完全同意

杨克：人工智能早已进入你的生活了。语音识别又是一根很好的例子。搜索引擎里也用到很多人工智能的东西。这一方面百度好像还走在谷歌前面。现代的汽车一般都有几十个电脑－－都不需要自动驾驶车。

李飞飞：但是广大老百姓心目中的人工智能是带有情感、情绪和像人一样的灵活分析纠错和行动能力的东东。

雷鸣：@Ke Yang 同意。但看起来还是早期。我觉得现在的人工智能应用，跟94-96年互联网那样

余凯：我觉得，在线教育，是深度学习大规模应用的一个垂直领域

杨克：实话实说。其是谷歌里面还是有很多深度学习的应用。很多我们也没有说。但是我们总体会慢一些事真的。

雷鸣：非常早期，一切都有可能，但是都没有真正大规模的用起来，到用户非常满意的程度

李飞飞：但是人工智能的产业应用还是更低层，更实际。

余凯：实话实说，百度过去在机器学习方面的积累少，所以可以更大胆的应用深度学习，这有历史原因。我也爱阿里的alan qi, 哈哈

杨克：我们的社会正转型为数据时代，那么人工智能就是数据时代的王者了－－这句话我不一定赞同。就想说大家都用电脑了，做CPU才是王道。

雷鸣：任何一个事情都需要多方面的积累，但是CPU是关键的一环。

余凯：语音识别，图像识别，自然语音理解，我觉得会持续推进。这三个领域，应该会诞生3个500亿美金市值的公司，在今后的10年里。大家拭目以待

杨克：我觉得人工智能会慢慢变成一种commodity，所有人都会用到。就像多核处理器一样，原来觉得很玄妙的东东，现在手机里都变的士。关键是要找到好的killer app

漆远：同意杨克的说法，不过在人工智能变成一种commodity前，确实会很可能有人工智能公司的rising

雷鸣：我同意杨克的观点，技术本身会慢慢变成不是最关键的，关键的是使用这些技术，真正解决实际问题

余凯：教育，金融，医疗，交通，智能家居，娱乐，等领域，都会有大的机会。

雷鸣：教育，金融，医疗，交通，智能家居，娱乐，等领域，都会有大的机会。

漆远：5年可能太快了吧。

李飞飞：首先从辅助诊断开始。

雷鸣：到达到医生水平需要多久？你觉得？5年，10年

雷鸣：@余凯，确实，现在机器学习工程师确实一人难求啊！各位搞这个方面的，可是生逢其时啊！

李飞飞：说实话，要是数据不是问题，我认为今天的人工智能已经能在80%的病症方面达到普通医生水平。

漆远：这得看是哪一个科目的医生

雷鸣：哈哈，看来医疗这个方面，未来大有可为啊。教育方面呢？大家如何看？

余凯：医疗是人工智能的大战场

雷鸣：人工智能如何提升教育，老师会被替代吗？

余凯：不会，再好的老师，也需要助教不是

雷鸣：@余凯，那就是人工智能做好老师和家长的教学助理？对吧

余凯：是的，我觉得是

沙飞：more precisely, “data-driven personalized education monitoring/tutoring systems”

雷鸣：机器人方向呢？你们觉得服务机器人未来5年会大行其道吗？

李飞飞：传教，授业，解惑。人工智能可以做一小部分。

雷鸣：阿里巴巴也投资了

漆远：follow 前面的话题：大部分人大部分时间得的病都是小病，所以人工智能在医疗上可能会很有实际用处的。

漆远：在中国，服务机器人没准也很有用处的；银行的服务窗前队伍太长。

余凯：比如Nest的平台，本身就在朝着智能机器人的方向走，虽然不是人形机器人

雷鸣：那就是智能硬件，智能家居这个方向？传统的东西，更有智慧

李飞飞：这些家用的物联网上的东西，会最早应用到底层的人工智能，形成智能物联网。

杨克：人工智能会从最琐碎的事情开始代替人。现在的电梯都是无人的。现在的车的cruise control越来越好，都是典型

雷鸣：各位觉得，在人工智能方向，创业公司和大公司相比有什么优势劣势？小公司有机会翻盘吗？

杨克：所以我觉得医疗上会是从边缘的地方开始，比如说 triage, screening, etc. 取代医生还需要一段时间

李飞飞：纵观人类上下五千年，小公司永远有机会翻盘，然后变成大公司被淘汰

漆远：大公司有机器有技术有数据，但可能少了些craziness和不同的角度。

漆远：还少了些灵活度。大象跳舞不太容易的。所以小公司总有机会。但大公司，也许尤其在中国，确实是有天时地利人和的优势。

杨克：同意。余凯同学刚刚离开百度，所以我可以猜到他是怎么想的。我前天刚刚从谷歌离职，也要加入一家小公司。smaller companies distrupt bigger ones

余凯：大公司会在自己的核心领域不断加力，但是在核心领域之外有所作为，会比较难。

雷鸣：要么对话部分先到这里，我们进入群友提问时间，如何？大家有什么问题希望和嘉宾探讨，请开始提出。

关于我们 IDataScientistUnion
数盟网站：www.dataunion.org
数盟微博：@数盟社区
数盟微信：DataScientistUnion
数盟【大数据群】272089418
数盟【数据可视化群】 179287077
数盟【数据分析群】 174306879

（长按可关注）

王安志川大 · 发表于 2015-7-7 13:47:06

贾老师，这是史上最强论战第二弹，请问史上最强论战第一弹是是什么？有没有链接？想去看看，谢谢

贾伟中科院合肥 · 发表于 2015-7-7 13:56:53

王安志川大发表于 2015-7-7 13:47
贾老师，这是史上最强论战第二弹，请问史上最强论战第一弹是是什么？有没有链接？想去看看，谢谢 ...

题目是转载的，易造成误解，已经修改。

强势围观一线大牛关于人工智能和深度学习的讨论

相关帖子