VALSE

查看: 5610|回复: 1

【爱奇艺CTO 汤兴】视频进化(12页PPT图文详解版)

[复制链接]
发表于 2015-4-9 23:01:08 | 显示全部楼层 |阅读模式
【爱奇艺CTO 汤兴】视频进化(12页PPT图文详解版)2015-03-31 汤兴 [url=]杨静lillian[/url]

【静点评】我与爱奇艺公司的合作最初是从爱奇艺首席科学家王涛开始的,他去年曾经在静.沙龙分享大数据时代的视频智能分析与服务。今年1月24日,爱奇艺CTO汤兴又在静.沙龙在线分享了《爱奇艺大脑——视频进化》这一专题,(请参考阅读原文)当时他的分享引发了专家们的强烈关注与赞赏。

     得悉静.沙龙一周年和新智能时代论坛即将召开的消息,汤总和爱奇艺的王涛、杨琛都积极支持,他们帮忙找来爱奇艺科技频道作为论坛的战略合作方。论坛当天,爱奇艺进行了新闻报道,还帮助录制了静.沙龙一周年的13段视频祝福,帮助我实现了关于论坛的视频记载梦想。

     而汤兴在本次新智能时代论坛的演讲,的确是最接地气的一个。一开场就得到在场9成观众的认同和支持。因为人工智能的理论再前沿,再高端、抽象,也毕竟需要与现实生活进行对接。而视频的智能内容分析、智能推荐、智能流量预测,以及虚实结合的视频进化未来,无一不与人们的日常生活娱乐息息相关。

     人们可以看到智能如何高效率地在“爱奇艺大脑”中实际应用,而每一种智能技术的突破,都会带来视频进化的神奇效果。其中的关键在于,大数据和人工智能,的确帮助爱奇艺和广大用户实现了以往靠人工不可能完成的事。例如Video In 和Video Out这类黑科技,能让广告达到“随风潜入夜,润物细无声”的效果,让用户喜闻乐见,并与电商结合。相信正如汤兴的预见,随着“爱奇艺大脑”的进一步成熟,虚实结合将塑造视频未来,而视频进化将率先步入新智能时代。



【汤兴】刚才听了各位来宾的演讲感觉压力很大的,感觉我讲的太接地气了,各位讲得高大上,做个调查,在座的各位看网络视频的请举手,会看爱奇艺的举手。基本上差不多90%。

 我今天会给大家回到现实的生活中,讲了那么多的人工智能,那么多智能化的时代,今天的现实生活中,视频领域发生着怎样的变化,或者我们怎么样利用智能改变我们的生活。我会先回顾一下视频整个的发展史,很短,不到200年,爱奇艺只有5年,爱奇艺的发展史浓缩了视频的发展阶段,可以看一下基本是六大阶段。

 从18世纪,视觉残留理论发现之后,电影诞生,从无声的电影,黑白的电影,到后面高清的,3D的,4D,5D的影院;刚开始黑白的电影电视是不清楚的,我们希望清楚,后来发现光有图象没有声音,和日常的沟通相悖的,又加了声音。后来声音感觉不够动听,开始出现了立体声,杜比公司作出了巨大的贡献,开始有环绕立体声,家庭影院。传输技术的改变,从你只能到电影院里看电影,变成了可以用无线电波看电视,后来通过有线电视可以看到高清电影,互联网的出现,把电影和电视搬到了互联网上,才有了在线视频。大家再看在线视频和TV的主要区别,是可以互动,TV上只能选台,互联网上可以快进,评论,点赞。爱奇艺是最近一二年开始做云计算,2013年启动爱奇艺的智能化的项目,发展了两年的时间,今年最火的方向是虚实结合,这是一个大概的整个视频行业的发展的简史。



 看一下现在我们做了什么。这是视和听的演进,在线视频出现的时候都是SD的,320*240的,当时爱奇艺上线的时候,第一次把高清视频搬到了网上,推1080P,去年1月份全网推出4K。去年春节之后,曾经在业界有一个很小的轰动,因为当时在爱奇艺网页上出了小的视频,只有3分钟《叶落知秋》是第一次一个影片从拍摄到后期、上传、在线的编解码、到播放是完全的4K,如果有4K显示器可以看一下,品质感非常强,以后4K电影流行之后,明星会非常的难办,因为所有的化妆,毛孔会看得一清二楚。原来观众只是在网上听立体声、双通道,去年爱奇艺和杜比合作推出环绕立体声,我们把电影的发展阶段,快速的推向中国的互联网,今天在互联网上,几乎可以享受到视频所有的画质和音效。最早在电影院看电影,后来有了无线电,在家里看电视,小时候谁家有18寸的彩色电视机,大家都会去他家看电视,现在各家有线电视都快被拆掉了,好处是可以随时随地看,可以挑选不同的清晰度,可以互动,我们看一下未来,互动是在视频上了互联网之后才有的,最早人们可以在视频上发现拖拽行为,可以点赞,进行评论,最早是人和视频之间简单的互动。后来是人和人之间的慢慢的开始有了互动,因为大家都在评论同一个视频,一个人可以回复另外一个人的点赞和评论,现在的趋势是说人和服务通过互联网做进一步的连接,我们也看到了在互联网整个的平台上会在看电影的时候,或者看视频的时候,会卖电影票,推荐不同的游戏,推荐不同的商品。从互动的角度再把现实生活中的商业搬到线上,推动服务进行连接。

回到今天讲的话题,智能化,我认为这是水到渠成的事情,不是点状的东西,前面嘉宾也讲到这是逐步发展的过程,所谓的智能化是因为云计算和大数据的发展,没有数据,没有计算能力的时候,智能化是无法发展的,记得我还上大学的时候,我的师兄研究神经网络,八几年,九几年的时候,有一个思潮大家认为神经网络是彻底的忽悠,是伪科学,是不可实现的。十几年之后它卷土重来,因为我们有了大量的数据,有了海量的计算能力,没有这两点智能化是无从谈起的。互联网的视频是看不完的,一个人每天看2小时的视频,看一辈子,看60年,最后可以看到3%的视频,其他97%的视频连看的时间都没有,这样怎么找到喜欢的,靠自己是很难的,通常是靠机器的计算,学习你的兴趣,这是个性化推荐做的事情。


   

很多人有手机,调查的结果,80%的人会把手机里面应用程序的推送关掉,认为那个通知很干扰他们的日常生活。不知道在座的各位多少人会关掉,但很多时候其实你希望得到感兴趣的东西的通知,你喜欢体育节目的时候,希望知道体育比赛的结果,希望知道体育直播的开始时间,这就依赖于个性化通知,它在利用智能化提供个性化的服务;个性化的广告和大家的关系可能没有前面两个感觉深,总体来说消费者总是讨厌广告的,广告主总是希望到达消费者,而视频平台总是两边都要讨好的。中间讨好的解决方式就是个性化推送,让人觉得感兴趣,又不会觉得厌烦。比如说2月14日,以前我们投过一个广告,比如投玫瑰花。广告主、广告平台和整个用户会得到一个大家三方面的满足。回过来,我知道大家会追剧,不知道有没有注意到,整个互联网平台爱奇艺追剧是最快的,任何一个电视台播放完了2分钟之内爱奇艺会上线,任何一个直播结束之后爱奇艺会上线,任何一家网站做不到这个速度,通常最快的是30分钟,而我们可以做到一两分钟,为什么可以做到,是靠智能化的视频内容和分析。我们知道传统的互联网是图文时代,渐渐快速进入了视频时代,我们对视频的了解还是基于只是文本描述信息,并不了解视频里面的内容,为什么那么慢,因为流程需要在电视台录制信号,编辑要进行处理,去掉不要的广告和台标,加上自己的描述,重新转码上线,我们现在把整个的流程全部自动化。也就是说一个视频在从电视台录制信号进来之后,我们自动进行场景的分割,片断的分割,以及广告自动的识别,会自动的进行卡段,会自动的进入后台。原来需要编辑输入标题和介绍,现在百分之八九十以上工作是自动化完成的,很多的字幕是自动识别的,语音是自动识别的,语音的截图也是自动的。每个视频的截图不一样,对点击率的影响是非常大的,尤其是用户上传的视频,用户不知道哪一节的哪一张图影响会大,我们会挑吸引用户的进行推荐。大量的视频有盗版和黄色,大量的用户喜欢上传这种视频,以前非常痛苦,编辑在几千上万的视频里面找到并且删掉,这是非常痛苦的过程,很多时候就加一段,比如加了科比的名字,就会被说这里加了盗版视频,靠人力是解决不了,后来智能化处理,准确率超过了99.9%,远超过人的操作。视频的生产,上线,审核流程实现了完全的智能化。

回到票房流量预测,这是很多互联网公司在做的事情,谷歌也做过。视频行业是特别烧钱的行业,早上醒来,拿打火机烧100块钱,没有我们烧钱的速度快,今天是加一个鼓风机都没有我们烧的速度快。对我们来说最大的成本是版权,买一部剧,一部电影的时候,根本不知道有多大的票房,收视率,播放量,也无法知道ROI是多大,我们以前花了4000万买了一部电影,放下来收益只有800万。很多时候拿到剧本就要决定买还是不买,这个行业的竞争是非常残酷的。我们做了一件什么事情,在这个行业为了节省我们的资金,为了给广大的用户更多的内容来看,我们要猜测哪些是我们网络视频用户感兴趣的东西,我们做了这个模型。左上角是《来自星星的你》,这部剧掀起了韩剧疯涨的热潮,那之前韩剧大概一部剧集最多1万美金,之后涨到20多万美金,原因是这部剧非常火,去年初红遍大江南北。左下角是《战神》提前半年预测的,准确率达到95%,右下角是爱奇艺的电影指数,电影是更难预测的东西,会受到各方面的影响,电影靠广告是不可能收回成本的,更多的要靠收费,决定了到底有多少用户会对他感兴趣。我们做了电影指数,红色是预估的结果,最近在做一个有意思的事情,《天降雄师》,正在放映的电影,我们的内容部门在打赌,说不可能票房过7亿,计算机算是7.5到8亿之间,我现在问了一下现在票房是7.4亿,这个角度来说利用智能,让电脑不只是搜集信息,分析信息,而是一定要帮助我们预测未来,这种预测是靠人脑做不到的。


 下一步我们做什么,视频的发展到了后来会发现,光了解表相已经不够了,光了解信息不够了,我们开始改变现有的视频。要让视频里面有真实和虚拟的相互结合。我们在海量的视频里面加入虚拟的物体,从二维到三维,左边加了图,右边是加了可乐罐,看起来是一个技术,以后看到的视频是没有广告的,但广告已经投入到整个场景里面,所有的这些制作是后期的,而且可以实时在线做。


虚实结合的产品,Video out,以前看到一个明星的衣服不知道是什么牌子,要到百度进行搜索,而现在我们自动识别场景,知道用了什么包,戴的项链,我们和电商结合,以后可以一边看,一边买东西。现在识别的精确度到了85%以上,对TOP5的商品类别,经过深度的识别,进行精准的标签匹配。


   

结论,经过前面的从音质,画质,传输,到互动的发展,视频行业、娱乐行业进入了智能化和虚实结合的时代,爱奇艺从2013年开始投入,我们相信这种变化会让智能时代在视频行业会更早地感觉到。谢谢大家。


            

以下为观众提问:

  提问:讲得非常有意思,转变了我对爱奇艺的看法,感觉在线视频对未来的展望,提到了虚实融合,看起来是往影片里面植入真实的物体,看起来会为未来的广告产生新的空间,这个本身不会对原来的节目本身的完整形态产生破坏,这个度摆在哪里?

  汤兴:电脑会自动对场景进行识别,之后会找出来对用户来说干扰最小的场景,后面会有人工复核的流程,结果是希望在相对静止的场景,相对空旷的区域,对用户没有太大干扰,这并不只是对广告,对视频制作也一样。春晚已经开始用虚拟现实,全息制作,我们的节目也在进行改变,以前做一个综艺节目,后面都是绿幕,再替换其他的场景,未来都是动态的,主持人可以随时身处不同的场景里。


       附:新智能时代论坛讲者简历

汤兴,男,爱奇艺CTO,早年于中国科技大学获得数学博士学位及经济管理第二学士学位,曾任谷歌上海研发中心技术总监,全面负责Google视频搜索业务及参与YouTube视频搜索服务的研发。2012年3月,出任爱奇艺首席技术官,主要负责技术产品工作,全面推动爱奇艺的技术与创新能力,提升用户体验。汤兴博士拥有超过十年全球TOP IT 公司研发及管理方面的工作经验,涉及互联网,手机和电视各种平台,具备建设和领导来自世界不同地区多元文化团队的丰富经验。2014年,汤兴被CSDN、BT传媒联合评选为“2014最具价值CTO”


回复

使用道具 举报

2

主题

5

帖子

32

积分

新手上路

Rank: 1

积分
32
QQ
发表于 2015-4-10 11:47:19 | 显示全部楼层
我印象中,向视频中结合生成并插入广告,msra的华老师,很早(5年前)就有这方面的工作。应该也申请了专利了吧。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2024-3-29 16:38 , Processed in 0.022406 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表