贾伟中科院合肥 发表于 2015-6-21 01:31:03

如何看待 2014 年以来计算机视觉(Computer Vision)界创业潮?


http://www.zhihu.com/question/31430100/answer/51997378?from=groupmessage&isappinstalled=0

如何看待 2014 年以来计算机视觉(Computer Vision)界创业潮?
2014 年开始 CV 工业界变得非常热闹。先后出现了大量高品质的创业公司。比较有名气的如下
SenseTime 商汤集团 SenseTime: Dedicated to Invention of Computer Vision and Deep Learning Technologie
团队比较强,据说已经聚集了 40+ CV 界大牛,IDG 投资
Cogtu 知图科技 Cogtu| Reinventing Advertising
CV 应用到广告领域,知图赞助了 2015 的 CVPR,几乎每个参会者都知道这家
马隆科技 码隆科技
微软 Matt 产品大牛的公司,达晨创投投资
Linkface Linkface - 全球领先的人脸识别技术服务
比较特别的女性主导的技术创业公司,刷爆了 FDDB
Face++ Face++ 最好的免费人脸识别云服务
人脸识别,主攻金融,阿里巴巴投资控股
Deepglint 格灵深瞳 DeepGlint-格灵深瞳
CV 应用到监控领域,红杉资本投资

这个现象已经表明 CV 一些技术已经可以从研究界走向工业界。这波潮流应该怎么看呢?产品工程大牛们是否值得考虑去抱研究大牛的大腿赶这班车?哪几家公司最值得进?

1 条评论分享




什么是答案总结? 答案总结


查看全部 12 个回答
赞同210反对,不会显示你的姓名
http://pic1.zhimg.com/da8e974dc_s.jpg Naiyan Wang,CS PhD, 机器学习与计算机视觉 收起
EthanLC、尹沛劼、梁博文等人赞同

谢邀,fresh PhD还在等实验结果的间隙来回答一下这个问题。。。受限于见识和视野,很多地方肯定考虑得浅薄,各位轻喷,欢迎交流。

首先楼主给出这个list还很不全面,了解到国内一些比较大的团队还有亮风台,依图,minieye等等。

从research的角度来看,这是vision最好的一个时代,也是最坏的一个时代。
作为我们这批10年11年入学的phd,有幸见证了vision这十年甚至更久一段时间内的最大变革,deep learning。说是最好的时代,我们见证了一些经典的high level vision问题在controlled environment下基本被解决,比如人脸相关以及通用物体的分类与检测。这在四五年前我们phd刚刚入学的时候简直是不可想象的。看上去一切触手可及对不对?可是我们离真正的人工智能还有多远呢?至少还需要有两三个这样的变革吧。当deep learning以迅雷不及掩耳之势席卷了整个vision圈提升了各种state of the art之后,很多人都发现原本的很多research问题直接就变成了engineering的问题,就是train个CNN就好了嘛。当然我是不赞成这种悲观情绪和deep learning一统论的。就像工业革命中,新的技术出现必然解放了大量低级劳动力,短期内会导致工人的下岗潮。但是我们应该做的是及时应对这种变化,调整生产结构。而不是归罪于"新技术抢了我们的饭碗"。同理在research这个道理亦同。只不过现在大家都还在摸索期,所以感觉都比较痛苦。

言归正传,其实现在大多数vision的创业企业技术上来讲都是借着deep learning这波东风起来了。这也是这些企业技术上能做到一个基本可用程度的保证。所以,大部分公司的技术业务核心也就是会在这些在学术界觉得基本已经没有太大研究价值,基本已经成熟了的问题上。(当然,这个只针对这些以high level vision为卖点的公司,现在仍然存在一些point不在这里的startup,但是一只手应该就能数的过来吧)基本上来说,我觉得这些公司可以大概分为两类:
1. 以技术为导向: 以提供技术服务为目标的企业。这类的代表就是Face++, Sensetime。这类企业基本不会去做到市场端的产品,更多地是提供一些已经成熟可以deliver的技术。其实不得不说现在大部分所谓的vision startup都在扎堆这类里。个人觉得,这类服务性质的需求会一直存在,而且就算vision这个泡沫爆掉了,这样的需求也会一直存在,区别只是量的大小。在市场进一步成熟之后,这个市场应该会出现两三家巨无霸,吃掉其他公司的份额。所以,大部分公司的下场就是一个好价钱被收购(其实这也是很不错的结果了。Google和FB在国外这两年已经吃掉了无数家这种startup)或者直接被挤倒。

2. 以产品为导向:这类公司的卖点不像前一类公司,卖点在于技术多么多么nb,又刷爆了几个benchmark。这个公司更在意的是把技术落地到一个产品。但是,前面提到,我们离真正所谓的人工智能还隔着一个银河系的距离,现阶段这种"伪智能"能产生出什么刚性应用场景呢?刷脸支付?拍图搜衣?无人车?无人机?就目前的情况而言,vision在一个完整的产品中,大多是一个锦上添花的角色,而不是非你莫属的刚需。当然,在当前技术条件下,如果谁能回答好这样一个问题,我觉得毫无疑问会成功。


出这两者之外,还有一些很有意思的方向,我个人觉得比较有前途的是做vision和AI相关的硬件芯片。据说百度IDL余凯老师离职之后就会去开创相关的一家startup。这个方向刚刚才起步,玩家不多,我们拭目以待吧。

综上,Vision创业现在还在一个上升期,同时也是一个泡沫期,一切看上去很美,似乎可以做很多事情,但好像又什么都做不了,(允许我狠狠地黑一把Siri)。迟迟没有出现一个杀手级别的场景和应用。如果这种态势持续太久,我觉得对于整个生态圈来讲都不是一件好事情。不排除某一天投资人们厌倦了,热钱变少了,这一场大戏说不定就会落下帷幕。当然,这种情况谁都不愿意看到,不过有空多爬出vision的圈子看看外面大家在做啥也总是好的。更何况,vision这东西和ml, dm, nlp这些都不分家,甚至往广泛了说跟big data和data analysis这些关系都很大。如果vision的寒冬降临,也还有个保命的看家技能不是 :-)

利益相关:我在Cogtu,女朋友在Linkface

发布于 昨天 02:0657 条评论 感谢 分享 收藏 • 没有帮助 • 举报








更多回答
57
赞同57反对,不会显示你的姓名
钮圣虓,努力成为会写代码的学术狗、工程狗、产品… 收起
欧长坤、黄黄、杨肉等人赞同
努力用个人浅薄的经验答一记。很多答案从技术角度谈了CV界目前的发展情况,我从另一个角度谈些其他的。

先上个人观点:这些公司如果继续按现在的路线发展,结局基本肯定不是被收购就是倒掉。几乎不可能成长为中型或大型公司,也不可能一直独立保持一家小而美的小公司。至于潮流,潮流肯定还没到,只是溅起一点水花,CV界目前不成熟的不是技术,而是能让这些技术有出路的强需求。工程大牛建议继续观望,或者可以去其中非常重视工程人才的公司,这个重视指的是比学术人才更重视。

为什么这么说?这里打个比方,如果把开公司比喻成在原始社会建立一个部落,如果你是酋长你会如何控制部落的男女比例?很显然全是男人和全是女人的话,发展部落肯定是没戏的吧。然后有一个很有意思的选择,一个是只有一个女人其他全是男人的配置,和只有一个男人其他全是女人的配置,你觉得哪个方案更可能壮大部落?嗯,经过30秒邪恶的思考你一定得出了正确的结论吧,肯定是一个男的和剩下全是女的部落可以壮大。因为一个女的即使年中无休,一年最多只能生一个吧。

如果把学术人才类比上面的“男人”,工程人才类比“女人”。那你就能看出上面公司的问题了,这些公司初创成员几乎全是学术背景出身,极端缺乏多年经验的工程人才,有技术没产品。简而言之,就是部落全是男人没有女人。

当然最好的状况是公司人才既是学术大牛也是工程大牛,类似于雌雄同体的娜美克星人吧(这里可以逃吗?),目测上述公司这种人才不多。当然放眼整个IT界这种能同时兼备这两种优势的大牛也是屈指可数的。

这个尤其体现在SenseTime 商汤科技,如果真有40+个CV大牛,那其实是个危险信号(除非他还另外招了300个工程人才)。危险的不是工程人才太少,学术人才太多,危险的是这公司似乎过于重视学术人才了,那么即使将来有工程大牛去那里估计也无抬头日,创始人的观念里可能包含了“学术比工程高大上”这种非常错误且危险的“重男轻女”观念。

这种观念会导致什么问题,其实从他们目前的发展路线已经可以看出来了。一个个说,先说共同点,几乎每家公司都声称已经掌握了世界领先的技术并引以为豪,然而没有一家拥有直接面向终端普通消费用户的产品,客户全部都是公司级的( 码隆有普通用户产品,这里跳过)。这暴露出一个什么问题?这些学术大牛,技术研究的是不错,但是完全没有研究过用户需求市场,只是感觉我的技术一定很有应用前景。毕竟大多数都是刚博士毕业或者常年在高校没在企业干过的学术人才,对数以亿计的普通用户市场的了解几乎是一张白纸,而这些用户才是互联网的真正金主,因为不了解,所以做不出能运用他们CV技术解决用户痛点的产品,所以干脆直接避开了普通用户群,把客户定位在企业级(还有一些开发了SDK和API提供给开发者用户,这个后面另说)。

那么定位在企业用户有什么问题呢?问题一是用户太少,能服务上千公司已经是不可思议的多了,所以几乎可以肯定只能跟企业做一锤子买卖,没有二次价值可以榨取,你总不可能给企业推送广告吧。既然是一锤子买卖,可以依靠全球领先技术提高定价吗?其实在中国最抠门榨不出价值的用户不是2、3线的屌丝键盘党,而是数以千计的土豪老板。如果你给他们开高价,他们首先会思考,“我多雇两个5000块的人能不能人肉把这件事搞定?”,如果雇人搞定的成本低于购买你的CV服务的价钱,几乎一定选择多雇几个人来解决问题的。格灵深瞳估计就有这个问题(创始人可以就这点来自己谈谈),监控视频是很多,但为什么对方愿意分享给你?当然如果你奔着大数据的价值而将CV服务低价出售可行,但这些无关联无用户的监控数据真的能产生价值吗?表示怀疑。如果提高CV服务的价钱,那么老板们又要衡量究竟是雇人划算还是用你的产品划算了,你不要以为你的技术提升了企业的效率就潜力无限,很多政府机构、公共服务机构、国有企业、小公司不讲什么效率,只讲成本,雇人解决便宜绝对是优先雇人的。所以能养得起你的,只有少数不差钱的商业巨头。

所以以企业作为用户还能发展起来的纯技术性公司,只有一种可能,就是掌握真正全球第一且拉开第二很大距离,同时有大量专利护航形成竞争壁垒,有这些优势才可能独立成长成大公司和个别巨头形成稳定商业关系。目测这几家还没这么牛。

然后说一下提供API和SDK策略,这个策略类似于游戏引擎公司的策略,指望大量开发者能用你的API开发产品并从他们的产品中收获价值,但还是那个问题,开发者也只会用最便宜的,最易上手用户体验好的(这个又要靠工程人才和产品人才了),甚至不是技术最好的,你的API是最好用、最便宜的吗?

所以以企业为用户短期内可以让你挣到钱,但长期来讲除非你能长期服务到巨头形成稳定商业关系(如果都到这一步了离收购也不远了),否则很难挣更多钱,所以这些公司目前的市值多半都是高估的,投资方其实也都在等真正的干爹出马。因为干爹有产品、有使用场景、有需求,但缺技术。

除了上述关于用户的问题外,接下来分析一下因为缺乏工程人才而导致的各家独有的问题。SenseTime的CV大牛很多,从他们非常多的技术成果就看得出来,其他公司基本都只掌握一项全球领先技术,SenseTime掌握的全球领先技术几乎撑满了一个页面。但这些技术用在哪里呢?从主页还是以专业术语介绍为主可以看出他们应该还没想到吧。缺乏产品人才构思出运用CV技术解决用户痛点的产品,缺乏工程人才将产品落地,缺乏运营人才运营产品积累用户。目前的思路还是服务企业用户以及提供API供人开发,这是非常被动的外包公司的思路。所以目前的SenseTime只能说是一家技术外包型公司,只是干外包是撑不起他这个市值的,所以必须等干爹出手啊。

知图科技,他们现在在做的图片里放广告,在他们公司成立以前就见过类似产品了,还是冷饭热炒,技术不错,idea不新,赞助了CVPR想吸引更多学术人才,创始人明显还是过于倾向于学术界,还是那个问题“轻工程重学术”,只能等干爹来包养了。

剩下一众人脸识别技术公司,我就不评论什么了,都是只有技术没有产品,最后么就是技术和专利刺刀见红了,没其他故事可讲,第一名吃香喝辣,第二名及之后的应该是全部活不了吧。纯拼技术的公司,真的是只有第一名才能活啊。

最后再总结一下:如果这些公司确实一开始的目标就是被收购,那没什么好说的,路线没走错,然后尽快找干爹投资入股,不过竞争很惨烈,绝对不是像某些公司说的蓝海,绝对是红海(因为你没有产品和用户),拼的就是谁的技术最好,专利最多了,尤其是要重视专利,初创公司可以不打专利官司,但一定不能忽视专利申请,因为你打不起官司,收购你的大公司打的起,专利绝对是未来竞争的重要筹码,谁多谁有谈判权。

如果不想被收购要独立发展,赶紧放弃企业用户,开发产品发展终端普通用户,他们才是你们的衣食父母,找到一个细分领域的市场并做到第一才是出路。CV界创业的未来,有用户才有有价值的大数据,才有二次价值可以榨取。所以说实话,目前CV界缺的还是让技术落地的需求而不是技术本身。面向开发者的API和SDK可以继续保留,但请多雇点工程人才,尽可能提高API的使用体验降低学习门槛,最好也不要收费或者晚点再收。

最后的最后,多雇点工程人才吧或者说是非学术人才,比例大概是8个工程人才一个学术人才这样的比例,虽然学术人才必不可少,但能撑起科技公司的一定是非学术人才。

光有技术做不出东西来,套用一句流行语就是“然而并没有什么卵用”。






编辑于 昨天 20:4015 条评论 感谢 分享 收藏 • 没有帮助 • 举报






3
赞同3反对,不会显示你的姓名
知乎用户,3D重建/虚拟现实/野生程序猿 收起
Zhong Adam、王峰、Rolleima赞同
CV领域的大部分技术离成熟实用都还有段距离,但是目前创业环境这么好,大家都想试一试啦,有钱,任性,万一押中宝了呢

同时也一定程度反映出“浮躁”的创业氛围,找几个大牛,拉一堆投资,搞个大新闻,但实际上做出来的东西远没有达到预期(比如Leap Motion),技术上的限制没那么容易突破









页: [1]
查看完整版本: 如何看待 2014 年以来计算机视觉(Computer Vision)界创业潮?