CV与ML
关于之前老师讨论的问题的一些思考:首先呢,这里想表示一下ML和CV之间的关系(这是一些传统的观点):我们普遍认为,现在的框架大致是这个结构。也就是说搞计算机视觉的非常的依赖机器学习的东西,而计算机视觉区别与文本或者说是声音的,甚至是机器学习,是人类是觉得一些理论。很显然现在搞计算机视觉的很少搞人类视觉理论。我觉得这方面的主要研究还是要依赖认知心理学,认知神经科学的专家们搞出一些理论来。之前也在nature上看到很多关于人脑视觉皮层研究的,得出一些非常有用的理论,包括人脑中神经元的功能性的分化,例如,空间定位就有特殊的神经元来决定本来所在的空间位置。(当然这个实验是在小白鼠上做的实验) 而搞计算机视觉的呢,例如搞关注度或者是显著度的,可能更多的去关注认知心理学上的一些结论,可认知心理学领域的新知识(我并不是很了解)很难引入到计算机视觉里面来。还有搞人工神经网络,深度学习的,可能会去关注认知神经科学的理论。但是总体来说,搞计算机视觉的人绝大多数都是搞计算机科学的,不是搞心理学或是搞神经科学。所以在视觉理论知识的引进上,我觉得是存在gap的。所以,我认为我们现在计算机视觉上面很多都是摸着石头过河,或者可以说是更多的依靠的是经验,而不是理论。 下面我们来讨论一个更有意思的问题,我们真的是建立在机器学习上的吗?我觉得并不是这样,我心目中的一个框架图其实是这样的: 虚线其实是若有若无的,主要我觉得还是因为历史的原因,机器学习走在了前头。即便没有机器学习,我觉得数学家们也会高出很多漂亮的理论来。而且现在的数学家似乎也并不需要太多的视觉方面的知识,就像统计学习,low-rank,matrix factorization。其实并不需要太多的计算机方面的知识,也能做的非常的漂亮。 感觉搞科学的都很相似把!就像科学研究,一般不都是有两种形式,一种是根据已有的理论,通过推翻它或者是发展它来获得新的理论,然后再去验证他;还有一种就是通过大量的实验总结,来得到新的理论。我觉得从数学领域出发的就是第一种,数学家们完全可以在数学的领域搞来搞去,也会得到很多beautiful theories。后者就是搞认知心理学或是认知神经科学的人吧。说来说去好像现在搞计算机视觉的还是很像一个搞应用的! 说了这些,也是看来老师们的讨论有感,希望在此抛砖引玉了!
页:
[1]