文|张嘉琦
编辑|张友发
来源:毒眸(ID:DomoreDumou)
北京的咖啡厅是最能获知当下国内风口的地方,坐在咖啡厅里的人,从区块链聊到元宇宙,再聊到如今的AIGC。现在,几乎五环内的每一家咖啡厅,都有围在一起讨论AI的客人。
这波技术浪潮来得迅猛,而AIGC(即生成式AI,AI Generated Content)和元宇宙相比,显得更现实、更有落地空间。其中,ChatGPT的出现很重要,让每个人都可知可感可操作的应用,是AIGC能迅速席卷国内外各行各业的重要助推力。
另一个同样流行的概念是“大模型”。前百度总裁、奇绩创坛创始人兼CEO陆奇在前几天的一场演讲中提到,是OpenAI带来了大模型时代,而未来将会是“模型无处不在”的时代。
根据民生证券的统计,4月刚过半,已经有将近30个大模型发布,成为了新的创业风口。阿里巴巴集团董事会主席兼CEO张勇表示:“面对AI时代,所有产品都值得用大模型重做一次。”
让我们将目光转回到影视行业。在3月底结束的网络视听大会上,几乎所有人都在谈AIGC。——和两年前的长短视频之争相比,今年的平台故事显然都要围绕AI来做文章。
不过,究竟应当如何结合?似乎尚没有明确的答案。腾讯公司副总裁孙忠怀曾提到,“目前看来,ChatGPT应该可以应用于电视剧剧本的基础编辑,从而节省人力成本,但此外还有哪些可能性?”
这也是为什么,比起部分岗位已经被AI替代的游戏、广告、IT等行业,影视行业受到的影响并不大,虽然有很多人在保持关注、讨论与研究,但真正落地、投入应用的并不多。
毒眸(ID:Domoredumou)咨询了一些影视行业的从业者,得到的回答也差不多——他们并不认为AIGC在未来会全面取代创作者,因为“灵感和创造力是无法被机器取代的”,真正在使用的一线从业者也不算多。而显然,身处这波AI浪潮里的创业者们并不这么觉得,在他们描绘的故事里,新的技术将是一切问题的最终答案。
因此,我们将在未来持续与入局这一赛道的创业者进行对话,试图寻找除了“写剧本、画分镜”之外,AI与影视行业真正的连接点,以及游戏、音乐、短视频等我们关注的行业,正在或将会被AI改变到什么地步。
本期我们对谈的嘉宾是猴子无限的创始人尹伯昊。猴子无限是一家去年8月成立的AI公司,专注于模型调优。他们在初创时的第一笔投资,来自被称为“中国AI布道人”的陆奇。据他回忆,这笔投资的达成时间只用了十分钟。
尹伯昊2015年开始从事相关工作,一直在关注AI领域的发展,并从中寻找可能的创业机会,真正促使他投身这波创业浪潮的,是他判断到的技术拐点的到来,也就是经过多次迭代后成熟的ChatGPT4。
目前,猴子无限只有五名正式员工,全部线上办公,他戏称他们是下一代的“数字办公模式”。
以下是对谈实录:
AIGC,只是开始?
毒眸:在你的判断里,大模型所带来的最大变化是什么?
尹伯昊:很多人以为AI就到头了,但其实AI是一个前菜,因为它带来的变革是人类世界所有的信息都能用新的方式来处理。
最核心的变化是,AI利用数据的方式相比过去发生了很大的变化,比如说过去的1.0时代,像是腾讯会议,微信,本身不产生信息,只搬运信息,也没有信息处理能力;到了2.0时代,可能是人工建模,或者说是弱AI辅助的模型,比如Excel,CRMERT、HR人力管理软件等,很多的规则和流程是人类驱动的,这个过程中人类利用数据还是很困难的,需要大量的成本,要么是人类标注,要么人类设计流程。
而ChatGPT3做的事情几乎是无间段的学习,把大量的数据塞到这个模型里,它会自动学习。迭代到3.5和4其实是强化学习的过程,比起上两代,要么是完全没有信息处理能力,要么是有一些信息处理能力但是人为参与很多,现在是几乎全自动的过程。
毒眸:所以它改变的是人类世界处理信息的方式?
尹伯昊:过去我们想写一个剧本,需要读很多剧本,再总结出规律,比如“英雄之旅”的模式,其实就是人工建模的过程,那么如果文本足够多,拿到世界上所有的剧本,那我就能写出一个这样的剧本。
同样地,如果我想要一个姜文风格的剧本,姜文到底是什么风格?过去我们需要看完他所有的片子,去理解和总结,如果有一个姜文的专属大模型,就可以让AI写一个“姜文风格”的故事。
毒眸:相当于AI代替了人类总结规律的过程,还能复用这个规律。
尹伯昊:对,这是非常重要的特性。图像也是一样的,如果把姜文所有的电影里的每一帧切下来构建一个模型,它就能习得姜文的影像风格。这就是大模型时代,很多人没有看到这些机会,觉得它只是帮我们写点东西。
毒眸:我们目前已经投入使用的案例有哪些?
尹伯昊:我们在服务一个一次性电子烟的品牌,他们有八万封历史邮件,是一些客户的意见,比如烟弹上飞机会漏油等等,人工总结需要花很长时间,但是生成专属大模型之后,它会自动学习和拆解这些邮件内容,并且完成邮件回复的工作。
毒眸:听起来还是TO B的商业逻辑。
尹伯昊:我们解决的核心问题是数据到智能,目前还是TO大B(服务大型企业)的,本质是你给我数据,我给你模型,并且让这个模型在企业内部成功运作。目前我们已经跟海尔达成合作,给他们制作了创新设计中台。
当然,如果讨论个人数据到个人智能的话,就是数字生命了。用你跟所有人的历史聊天记录,就可以训练出你的对话模型,你历史上写过的文章也可训练成自己的写作模型,我们最终是一个大模型驱动数字生命的公司。接下来我们会也做每个人的数字生命,但还需要一点时间。
毒眸:前段时间比较火的应用Glow,也是定制模型的思路。
尹伯昊:对,我们还跟Glow竞争过客户,我们赢单了。我们在技术逻辑上是一模一样的,就是通用模型+私有数据=私有模型,只是商业逻辑不太一样。
毒眸:现在服务的或者说接触的企业里面,哪一类公司会比较多呢?我们比较好奇什么行业的人会在这个事情上面格外敏锐一点。
尹伯昊:都有,在现在这个阶段大街上拉一个人,没有人不聊。感觉反应时间的长短不分领域,互联网公司也有不着急的。决策快的人永远决策快,决策慢的人永远决策慢。
不过影视行业的客户目前确实还没有,可能他们还不认识我们。
毒眸:在你看来,AI和影视的结合点会在哪?
尹伯昊:大家的想象力还是太匮乏了,只是把AI当作一个辅助工具,“过去我拍一个东西要一天,现在只需要10分钟。”——想象力到此为止了。
但真正应该关注的是,新的媒介能够产生艺术形式。媒介是人的延伸,AI2.0本身就是一个新媒介。如果训练一个数字生命,这是不是一种艺术?训练一个每天能跟我聊天的机器人,是不是艺术?我觉得算,艺术的边界应该被媒介来扩展。
毒眸:所以真正能带来变革的是数字生命?
尹伯昊:核心就是数字生命。一个聊天机器人是一种艺术,如果我创造一个已经有基础设定的新世界,当中有一堆智能体,那么它本身又是新的艺术形式。
毒眸:听起来更像是游戏的延伸形态。
尹伯昊:对,所以游戏是比影视更大的市场,而且影视和游戏的边界也在慢慢模糊,这可能会是下一代的艺术。也许未来电影会变成游戏的先导片,先设计一个新世界,这个世界里每个人会产生不同的剧情。
毒眸:传统的影视形态会被完全颠覆吗?
尹伯昊:也不会,就像现在还有人看话剧一样。
AI无法替代的是……
毒眸:像你刚刚提到的,如果导入某个人的所有信息和资料,生成专属的模型,当中必然会产生版权、法律甚至伦理方面的问题,国家互联网信息办公室也在4月11日就《生成式人工智能服务管理办法(征求意见稿)》公开征求了意见,你如何看待这些问题的产生?
尹伯昊:这不是现阶段我们要考虑的问题,技术进步到一定程度,自然会有人来总结这些问题。之前在参加AI闭门会的时候,认识了一个拿过两次艾美奖的纪录片导演,他也来找我们聊合作。如果你不去主动拿自己的数据训练这个AI,就会有别人盗用你的数据训练AI。
毒眸:前几天跟一个电影导演聊天,他说如果有个很成熟的可以为他所用的AI,他就可以跟AI一起完成自己的电影,这样效率会提高很多。
尹伯昊:AI帮人类做辅助已经是非常确定性的事情,以至于我现在觉得这还用聊吗?难道不是已经发生了吗?
毒眸:生成一个专属大模型的时间大概需要多久呢?
尹伯昊:非常快,大家对AI有一个误解,觉得训练时间特别久。当然,因为AI学的是全世界所有的知识,又要学生物,又要学物理,还要学历史,又要学鲁迅讲话,又要学马尔克斯讲话,当然要很久。如果只学一个人,一天就足够了。
毒眸:现在我们还是聊文生文、文生图和图生图比较多,进入到三维模态会对影视行业产生更大的影响吗?
尹伯昊:对,因为3D内容很稀缺,建一个3D内容的模态要几万块钱。像是NeRF在做的事情是,我扫一圈大概需要50张图,能够生成一个3D模型,但如果结合AI,可能拍一张图就够了。我判断这个事情会在半年到一年的时间内发生。
毒眸:那文字生成视频呢?
尹伯昊:也是半年到一年。还是刚刚说的,动作快的人已经在技术非常不成熟的时候就开始了,慢的人可能永远都不会开始。
毒眸:现在很多影视和动画公司在管理数字资产、接入相关插件的时候,会遇到每个部门不统一的情况,大模型能够解决这个问题,帮助这些公司实现“资产统一化”吗?
尹伯昊:大模型本身是一种压缩方式,过去几万张图是几万个文件,但是大模型能够能把几万个文件压缩成一个文件,同时无损地解压出来,大模型就是压缩和解压的过程。
毒眸:同时还能够进行自主分类。
尹伯昊:对,可能10个角色的各1万张图全部压缩到一个模型里面,它可以灵活地解压出10个角色。你可以把大模型理解成一个可执行的压缩包,我觉得大模型有三个核心的特性,自训练、压缩和泛化,你刚刚提到的是压缩。
毒眸:现在很多人在面对新的技术浪潮来临时,普遍会产生焦虑情绪,如果大模型真的能替代掉很多工作岗位,未来会发生什么?
尹伯昊:首先,每个人都有base income(基本工资),这是一定会发生的,因为很多人就是会被替代掉。
另外一个维度关系到每个个体,比如说过去我是开马车的,现在我开汽车,所以新的技术也会带来新的岗位。过去写代码要很多人一行行地写,所以写代码是很贵的事情,现在写代码非常容易,人人都能写代码,造自己的东西,这个世界代码总量就会更多,工作机会也更多。
第三种就是会有全新的岗位诞生,包括现在我们公司有的新岗位,数据清洗、模型训练等等,这些都是新的工作岗位。
毒眸:最后一个问题,我们作为内容创作者,会认为AI永远无法替代的部分是人的灵感、情感和创新的想法,你同意这个观点吗?
尹伯昊:他们只能自己洗脑说“我是姜文”了。我是觉得AI现在可能只能达到写3年剧本的人的水平,但未来会一直突破,可能除了姜文的写不了其他都能写,而且它还能模仿姜文。
毒眸:那如果我们抛开内容创作者的角度不谈,你有没有考虑过AI永远无法替代的部分是什么?
尹伯昊:挺难的。
毒眸:比如说我们训练一个能够训练大模型的大模型,未来是不是你也可以被替代?
尹伯昊:那也有可能,我们所有人要做好拿base income的准备,这是早晚的事情。
本文转载自微信公众号毒眸(ID:DomoreDumou),已获授权,版权归毒眸所有,未经许可不可转载或翻译。
【免责声明】
关键词:AI | AIGC | AI Generated Content | ChatGPT | OpenAI | 区块链 | 元宇宙
过去近二十年的时间里,电影市场的下游制造过很多“传奇”:从第一家影城干到几百、几千家,从一无所有到成为中国电影票房高速增长的基石,又从疯狂扩张走到了举步维艰的地步——时代、环境在变化,而如今的电影院却好像衰老了一样。