这个行当里,目前不用AI不会被替代,但注定会被时代抛下
(Disco Diffusion当时的官方示例提示词生成图 提示词为“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme”)
文|徐文璞
编辑|谢丽容
29岁的海辛本科学医,但2017年毕业以后,跑到美国学电影制作了。学成回国从业三年,半路出家的她在行业里已经小有名气。按照这个行业的既定轨道,新人要泡十几年的剧组,才能一步步从底层走到制作院线电影的核心位置,这才算“出来了”。
2个月前,海辛被邀请去一个颇有分量的行业大会上做分享演讲,核心内容是她利用AI工具生成图片、特效和广告片的经历。那是大会最后一天下午,会场外人群稀疏,会场内却座无虚席。
AI、大模型,这些看起来和影视制作行业很远的科技名词,现在变得很近。
“有很多找过来的导演,对AI好奇心很重。美术设计从业者相对已经过了好奇心阶段,大量使用了——因为他们的甲方或者老板对此会有一定要求。”海辛对《财经十一人》说。
2022年上海疫情封控期间,海辛获得整块时间学习AI工具。
当年2月,一个极大提高了文生图质量的AI程序——Disco Diffusion,由独立开发者Somnai在谷歌Colab云服务上,开放给全世界用户使用。通过设置参数、输入画面内容和风格的关键词 (这个过程也叫做prompt,即提示词工程) ,AI就能生成相应的作品。
不同于人的思维,Disco Diffusion生成的画面通常更加疯狂大胆,这可以给人类美术师带来启发。同时,该程序基于MIT开源协议,所有互联网用户可以免费使用、复制、修改甚至出售生成图。这激励了很多美术从业者开始使用AI生成工具。
2022年7、8月,如今用户基数最大的文生图工具Midjourney、Stable Diffusion相继公开发布。
(2022年7月上线的Midjourney,2023年初在社群交流平台Discord上拥有了1千万用户,成为后者最大的社群。Discord上线于2015年5月。截图于2024年1月7日)
对于一直关注新技术的专业从业者,AI工具使用门槛低,几乎可以说是现学现卖。2022年5-8月的两个商业项目中,海辛大胆使用了新技能。AI可以几分钟生成效果图,大幅缩短过去美术师手绘效果图的创意脑暴时间。
此时,AI还在快速进化。继文生图工具后,文生视频工具Runway的Gen-1、Gen-2,Pika Labs的Pika和Stability AI的Stable Video Diffusion在2023年一头一尾发布。
2023年8月,海辛和团队使用Midjourney与Gen-2为联想制作了纯由AI生成画面的广告片——AI生成内容成了可交付的商业产品。这个AI视频广告花了3位核心制作人一个月的时间。如果使用传统的CG制作,这个视频将花耗一个半到两个月。从效果看,这条AI广告片发布于智族GQ视频号,点赞、转发、点心等数据都不亚于账号上其他有明星曝光或者真人实拍的片子。
海辛现在一个月能接到4、5个AI视频项目的咨询。她靠个人把控视频的内容创意、画面生成和剪辑。她还在学习AI工具,且主业是AI创业公司的成员,精力有限,现在维持一个月开张一单的记录。
2022年AI生成图片工具开始走向成熟,价值主要辐射美术设计师、摄影师等群体。2023年兴起的AI视频生成工具,标志着更为深远的转变。传统影视制作依赖繁杂且专业化的分工,AI工具的介入,让过去必须依赖美术、置景、灯光、摄影等一整套制作班底才能完成的工作,单靠核心创作人员在一台电脑前就能快速实现。
传统影视制作的门槛在被打破,影视创作的边界在被扩展,这给影视从业者带来新的挑战:如何在变局和新的竞争中找到自己的位置。只有不断学习和适应,他们才能在新技术引领下的行业完成晋级。
新工具出现
对于很多影视制作从业者来说,AI生成工具制造的“wow moment (震惊时刻) ”与2023年初ChatGPT出现的时间一致。
动画导演、兔斯基作者王卯卯告诉《财经十一人》,她在2022年秋天就注册了文生图工具Midjourney会员,但作为专业使用者对图片生成效果要求很高,而彼时Midjourney生成图“还很烂”,所以没有再关注过这款软件。
这时,一些开源社区的技术人员,在持续关注讨论AI生成图片、视频技术的进展。
到2023年2月,王卯卯再次在专业社群看到人们分享的Midjourney生成图效果时,才又充上会员。“短短几个月,已经可以应用到日常创作了。”
对传统影视行业从业者来说,乍一看AI生成工具的技术属性非常强。一开始接触时,从充斥着代码的用户界面,到更贴合技术人员思维的算法生成逻辑,他们都感到很陌生。
由此,AI视频创作者由两类人组成,一是AI技术相关人员,一是快速掌握新工具的传统影视制作从业人员。前者比后者更谙熟AI算法等技术原理,对于提示词工程也更加得心应手。后者比前者更具备内容创作的专业素养,生成的视频在故事创意、叙事节奏和技巧上,优势更加明显。
不过在AI生成技术飞速发展和工具快速迭代的2023年,技术出身的创作者往往能占得半步先机。多位受访者告诉《财经十一人》,如果按发论文的情况看技术更新,每天都有新论文出现。并且每隔半个月至一个月,就有一篇引发大量关注和讨论的论文。
在把技术封装成产品的工具层面,所有创作者都要持续学习不断更新的工具。
目前文生图、图生视频工具已经出现集中效应,Midjourney、Stable Diffusion、Runway和Pika等产品成为用户最主要的选择。这些产品的迭代都很快,彼此的竞争非常激烈,以周为单位变更效果领先的产品。
(注:Stability AI是Stable Diffusion的发行公司,该公司发行AI生成开源程序,让用户免费下载到本地,而不需要频繁访问公司网络主页 数据来源:similarweb 数据采集时间:截至2024年1月12日前28天)
除此之外,对口型、提升画质、音效制作等围绕AI视频制作的细分工具,也在不断出现和更新。这些产品中还没有跑出占领用户心智的头部,AI视频创作者需要不断尝试新产品,找到最趁手的工具。
为了不掉队,王卯卯告诉《财经十一人》,自己经历了高考以来最密集的学习期。2023年4月以来,她每周强迫自己学习2-3个软件。在X (原Twitter) 、Youtube上,她关注了大量AI视频创作者,“每天都很焦虑,打开APP,信息流就会喷涌进来。看到别人做出很牛的东西,我就也要弄一个,特别卷。”
真正到了创作阶段,传统影视制作从业者更能体会AI的价值。
2023年8月初的一天,在勤勤恳恳学习了4个月AI工具后,王卯卯觉得到了可以用AI做视频的时候。她构想了一个中国古代年轻人做时间机器的故事,从开始有创作想法,到生成主视觉图、生成动画,再到剪辑、加字幕,一个30秒的预告片她只用了3个小时。
“虽然当时的效果还是很粗糙,不过完成视频的那一刻,我内心的震动非常巨大。”
王卯卯的另一个身份是美国知名动画工作室照明娱乐 (知名作品有《神偷奶爸》系列和《超级马里奥兄弟电影版》等) 的动画兼创意总监。2022年王卯卯执导的一部10分钟动画短片《蓬莱》,用了50个动画师一年的时间逐帧绘制。
她告诉《财经十一人》,动画工作室在确定了创意后,利用传统方式制作一个30秒的效果片需要几个月,而现在借助AI可以缩短到半天。
全新的红利空间
胶片技术是电影发明的基础,数字影像技术彻底改变传统影视制作方式,CG技术让影视制作者创造出真实世界中无法实现的场景和效果……每一代技术迁移都会带来内容生产繁荣,同时创造全新的红利空间。
名望、金钱、乃至创作者的自由,是这轮AI生成技术能创造的红利。尤其在当下创新发展的早期,市场处于一片蓝海之际,先行者能更轻松吃到更大的红利。
Caleb和Shelby是一对活跃在创意艺术和人工智能领域的夫妻。看到AI生成视频技术逐渐成熟,他们设立了一个网站Curious Refuge (好奇避难所) ,其网站的后缀是The World's First Home for AI Filmmaking (世界上第一个AI电影制作之家) 。
顶着世界上第一个AI电影制作之家创始人的帽子,他们完成了自我造星计划,开始成为公认的AI电影制作先锋代表,频繁出席各种行业活动,组织各类商业合作。
与此同时,Curious Refuge通过互联网在全球发行AI视频制作课程,每位用户付费749美元,可获得一个月的线上课程和平台一年的社群福利。
在国内,不少AI视频创作者也在通过卖课变现。
李佳伟是一位前影视行业从业者,2023年6月开始他把全部精力投入到制作AI视频,现在正在进行AI视频教学的创业,业务涵盖创意内容生成、AI工具部署和模型调优。他告诉《财经十一人》,很多工作忙、单位时间贵的人,花钱上课的意愿很高。
就在接受《财经十一人》采访的那个周末,有一位从广东来北京出差的广告导演,打算用一万六预约李佳伟2天的时间,目的是从他这里了解AI视频创作的信息。之后这位导演会决定是否投入到AI创作。这类人群就是李佳伟创业选择的目标人群。
“这个业务可以做两年。”李佳伟预计。
卖课之外,直接卖AI生成的内容产品,也是创作者现阶段主要的变现途径。
虽然2023年AI视频的画质、效果还不足以达到电影级别,大部分创作者还是单打独斗,抱着兴趣了解的出发点试水。但是一个在2023年就明显出现的趋势是,商业短片和网络短片市场已经在接受AI生成的内容了。
九合创投创始人王啸告诉《财经十一人》,视频方向是内容市场当中体量最大的领域,一直以来存在生产成本较高、生产周期较长的问题。随着生成式AI技术的不断演进,视频内容的生产将逐渐可以被AI替代,从内容供给侧带来结构性的机会。
从需求端看,京东、淘宝、天猫、联想、可口可乐、奥迪等互联网品牌和传统大品牌方都有AI视频广告或TVC落地。
小红书博主@吴志气的本业是个广告人,他告诉《财经十一人》,已经有品牌在接触AI视频创作者。他收到的最高报价是8000元/秒,听过的最高报价达到了10000元/秒。不过目前报价的底线也可以很低,有的只有500元/秒。
由于@吴志气在社媒上还发布过AI短剧,优酷等视频制作播放平台的工作人员也曾找到他合作内容,平台方愿意每月提供固定的费用。
一面是AI生成技术的快速发展,以及对传统影视制作流程的重塑,另一面是明确的商业需求在不断涌现,这鼓励了有前瞻性的创作者们聚集在一起,将传统影视制作成熟的分工体系引入AI视频制作,为即将到来的AIGC广泛落地储备经验。
2023年下半年,王卯卯组建了一支AI制作小组,小组成员包括导演、编剧、故事版艺术家、作曲家、音效设计师5位专业电影人,外加一位AI工程师 (提示词顾问) 。此前,他们用2周的业余时间,合作制成了一支93秒的AI故事片。
王卯卯认为,AI视频质量将在一年内与传统影视工业相当,到时候会有庞大体量的AI制作需求出现。组建AI制作小组的目的,既是为了那个时刻的到来,更是为了通过高科技工具发展团队的原创IP。
谁会被替代?
如果在AI工具的辅助下,一个人、几个人就能完成过去一套制作班底协作才能做的事,那么在这个过程中,谁会被替代?
高鹏飞在北京有一家20人规模的广告公司,他告诉《财经十一人》,过去完成方案创意后要找分镜师绘制效果图,一般一分钟需要40-50张图,一张图300-500元,现在这个环节都用AI优化了。
一些简单的文案工作也可以交给AI。“万元以内AI基本都能做,万元以上还没有替代性。”
同时,过去由摄影师拍摄的产品平面图,一张500-1000元,现在也由AI生成了。
李佳伟认为,传统勘景置景的美术师受影响很大,他们做的氛围图现在用Midjourney等工具就能生成。
AI视频创作者刘国辉则认为,CG动效师应该紧张了。“CG建模往往要几天才能出效果,如果AI几分钟就能生成,他们的危机感会很强。”
刘国辉话锋一转,补充道:“并不是说以后所有环节的从业者都不用思考了,都被取代了。而是相关人员应该尽早接触AI,把AI纳入工作流。”
AI只是工具,需要人类的提示词指引才能生成内容,内容价值的高低与提示词工程师的综合能力挂钩,这是所有受访者的共识。
在这个维度上,谁会被替代的问题应该换成谁在抗拒使用AI。
王卯卯观察到,反倒是取得了一定成就的资深从业者容易“错过”AI。他们不迫切需要靠学习新知识提高竞争力,加上工作忙没有时间,就会逐渐抗拒打乱了既有工作流的新技术。
“我和一位制作过美国票房前三的好莱坞导演推荐AI时,他的回答居然是‘噢,AI我知道,It is taking everybody’s job (正在抢走所有人的工作) 。’”王卯卯说当她听到这个回答时非常震惊,因为“AI对于创作者来说是强助力,特别是导演这种具备综合素质的人,才能把AI的价值发挥到最大。”
另一种抗拒使用AI的情绪,来自对内容原创性的坚持。
尤其是刚开始使用AI工具的人,难免会怀疑AI只是一个缝合怪——AI生成内容本质上是通过深度学习模型分析大量数据,以学习和模仿输入内容的结构和风格,从而创建新的内容——如果创作者把学习的过程交给AI,那AI返回的内容属于AI还是创作者?
目前在国内,这个问题从法律层面有了明确答案。2023年底,北京互联网法院审结了我国首例涉及人工智能生成图片的著作权案,明确了利用AI生成的图片具有“作品”属性,使用者的身份属于“创作者”。
在海外,美国版权局出台的政策和联邦地区法院的判决也提供了初步答复:只有自然人才具有“作者资格”,也只能从“作者”的独创表达才能获得著作权的保护。
在法律层面,AI不具备创作者的属性。但是在艺术家心中,这或许是一个要久久叩问的疑惑。
“不用AI不会被替代。”李佳伟进一步否定了这个问题本身,“但是会被时代抛下。”
就像摄影出现了180多年,绘画并没有消失,传统的画家依然可以靠手艺养活自己。但是现代社会,人们对美术作品的需求远没有过去旺盛了。他解释到。
机会窗口还开着
对于仍想赶上这趟列车的人来说,为时尚不晚。
一方面是,AI学习的门槛没有大多数人想象高。
王卯卯认为,只要有电脑就行,门槛在于对知识和优质信息获取和理解的能力,只要不对英语、代码犯怵,就都能学。
海辛进一步解释,很多人以为要有算法背景才能做AI创作,其实需要学习算法和技术的情况很少。“在我的案例里,只要懂英语,知道系统报错的是什么,然后在互联网上找到解决方案就行。”
刘国辉则认为,普通人随意创作的门槛很低,但是想要商业化,精准控制AI工具生成特定风格的内容,需要一定的专业背景。“生成内容的商业价值越高,那它的制作门槛就越高。”
尤其是在传统影视行业担任导演、编剧等核心创作职务的人群,他们在AI视频领域依然是最有优势的人群。
技术背景出身的干祥阳,现在是小红书AI视频博主,他告诉《财经十一人》,“就像自媒体时代,做得好的是前媒体人,AI视频创作最精髓的要义,由传统影视创作者掌握。”
这个最精髓的要义,就是懂镜头语言、具备高超的故事表达能力。
另一方面是,目前AI生成技术还有缺陷,最主要的问题是视频的稳定性和可控性不足,解决好它们是AI视频进一步广泛落地的前提。
海辛解释,稳定性分成两部分,其一是画面本身的稳定性,不要跳帧。其二是细节的连贯性,比如现阶段还容易出现的问题是,上一个镜头人物戴着牛油果耳环,下一个镜头就变成了花环耳环。
控制性的问题则是指,目前AI生成视频工具提供的控制手段还太少,创作者主要基于参考图像的深度、骨骼、线条等信息进行控制。在实际的生产中,尤其影视工作里面,从业者还需要更丰富的布置,包括前景、中景、后景的分层运动等信息。
上述一些问题可以通过经验丰富的创作者反复调整提示词完善画面效果。王卯卯表示,目前在AI内容生成的过程中,反复调试Midjourney 20次、Pika和Runway 5-20次左右,基本能得到满意的反馈。
但另一部分问题仍待技术发展来解决。针对AI生成稳定性不足的问题,已经出现了animate diff的技术方案,“虽然还不能完全解决问题,但也可以清楚看到整条路径的发展,技术成熟应该就在今年。”海辛说。
无论是已经出现的技术解决路径,还是参照文生图的快速发展,2024年AI视频生成技术和应用会有质的发展,这是绝大部分受访者一致的观点。
届时,AI生成视频爆发的红利空间,将属于每一位拥抱新技术的创作者。
(作者为财经十一人特约撰稿人)