CV与ML

李浩然哈工大 发表于 2015-4-16 22:26:55

关于之前老师讨论的问题的一些思考：首先呢，这里想表示一下ML和CV之间的关系（这是一些传统的观点）：我们普遍认为，现在的框架大致是这个结构。也就是说搞计算机视觉的非常的依赖机器学习的东西，而计算机视觉区别与文本或者说是声音的，甚至是机器学习，是人类是觉得一些理论。很显然现在搞计算机视觉的很少搞人类视觉理论。我觉得这方面的主要研究还是要依赖认知心理学，认知神经科学的专家们搞出一些理论来。之前也在nature上看到很多关于人脑视觉皮层研究的，得出一些非常有用的理论，包括人脑中神经元的功能性的分化，例如，空间定位就有特殊的神经元来决定本来所在的空间位置。（当然这个实验是在小白鼠上做的实验）而搞计算机视觉的呢，例如搞关注度或者是显著度的，可能更多的去关注认知心理学上的一些结论，可认知心理学领域的新知识（我并不是很了解）很难引入到计算机视觉里面来。还有搞人工神经网络，深度学习的，可能会去关注认知神经科学的理论。但是总体来说，搞计算机视觉的人绝大多数都是搞计算机科学的，不是搞心理学或是搞神经科学。所以在视觉理论知识的引进上，我觉得是存在gap的。所以，我认为我们现在计算机视觉上面很多都是摸着石头过河，或者可以说是更多的依靠的是经验，而不是理论。下面我们来讨论一个更有意思的问题，我们真的是建立在机器学习上的吗？我觉得并不是这样，我心目中的一个框架图其实是这样的：虚线其实是若有若无的，主要我觉得还是因为历史的原因，机器学习走在了前头。即便没有机器学习，我觉得数学家们也会高出很多漂亮的理论来。而且现在的数学家似乎也并不需要太多的视觉方面的知识，就像统计学习，low-rank，matrix factorization。其实并不需要太多的计算机方面的知识，也能做的非常的漂亮。感觉搞科学的都很相似把！就像科学研究，一般不都是有两种形式，一种是根据已有的理论，通过推翻它或者是发展它来获得新的理论，然后再去验证他；还有一种就是通过大量的实验总结，来得到新的理论。我觉得从数学领域出发的就是第一种，数学家们完全可以在数学的领域搞来搞去，也会得到很多beautiful theories。后者就是搞认知心理学或是认知神经科学的人吧。说来说去好像现在搞计算机视觉的还是很像一个搞应用的！说了这些，也是看来老师们的讨论有感，希望在此抛砖引玉了！

页: [1]

VALSE's Archiver

CV与ML