数字遗照。 超级头脑团队供图
“我儿子因病意外去世了,我还想见见我儿子。”
2023年12月中旬,一则“失独父亲用AI复活病逝儿子”的新闻在海内外引起了广泛关注,故事里的中国父亲因ChatGPT、文心一言的技术工具的出现而看到希望,在辗转了多个团队后,最终收到了一段AI生成的儿子的视频。“效果是初级的,但从手机里再次听到儿子的声音,已足以让他的妻子在已故儿子的墓前哭泣。”
而这“AI复活”的最终产品正是由上海的超级头脑团队完成。该团队介绍,自去年3月份开始涉足相关领域,截至目前,已经为超过600个家庭提供了相关服务,其中大部分来自因疾病、事故或自然灾害而失去孩子的父母。
乘着AI浪潮,“AI复活”的产业正在悄悄萌芽。
萌芽
“AI复活”一单价格万元以下
“AI复活”最为人所知的或许是约十年前的英剧,《黑镜》第二季中的一集,女主利用意外身亡的男友在社交网络上留下的大量数据,重塑了一个模拟男友人格的AI。
而在现实中,像这样“通过另一种形式与虚拟化的逝者相见”的故事,正在新年伊始逐渐走入大众的视野。
“AI复活”是一类依赖生成式AI的底层技术,复现逝者的形象、声音、言谈举止,甚至是性格情感的产品,业内人更愿意将其描述为“数字陪伴”或“AI数字永生”。
对于初次接触“AI复活”这个概念的人来说,难以想象的东西还是太多了。最直观的疑问就是——AI“复活”某人之后,我们到底会以什么样的形式与Ta相见?
一段视频,一个可互动的程序,抑或是某种可真实触碰的全新物品?
上海超级头脑团队创始人张泽伟表示,目前团队的“AI疗愈”已经做了600多单,数字遗照、3D超写实的仿生数字人业务还没有大量铺向市场,仍在进行内部的细节优化和版本迭代中。就算是“安排上顶格的技术”,一单价格不会超过五位数。
由于“AI复活”本身就是一种从需求寻找市场的特殊行业,因此,超级头脑团队碰到的更多是为“带着需求找上门”的客户提供一对一定制版服务。
2023年12月中旬,海内外有媒体报道过一位中国父亲用AI复活自己病逝的儿子,引起了不少讨论,而其最终的产品正是由超级头脑团队完成的。张泽伟对他的故事记忆犹新。
“这位父亲一开始找到我们的时候,其实要求很简单,就说想克隆一下他儿子的声音,从这个点开始,又慢慢分散出现其他需求……其实最开始有这个概念的时候,我们也不知道要做什么,都是一些用户来找到我们,说他们要做哪些事情,我们再总结出他们的需求,最后才有现在这些产品。其实你现在来看,这位父亲的需求其实并不属于我们现有的任何业务形式。”张泽伟说。
“AI复活”形式并不相同
而事实上,涉及到业务层面,或者说产品的具体呈现上,“AI复活”的形式并不相同。
对于2017年成立的硅基智能来说,“数字永生”属于他们的几大业务板块,知识生产(视频)、知识传播(直播)、生命克隆和知识创作(文娱)中的其中之一。在类似领域,他们最出名的是将全网千万粉丝的科技博主@严伯钧“AI化”,让“AI严伯钧”能以原主风格形态自主创作有真人出镜的科普视频,时至今日,严伯钧的粉丝们仍在孜孜不倦地观察,今天发视频的到底是AI还是严伯钧本人。
其中,“AI复活”相关业务属于他们的“生命克隆和数字永生”板块,目前已经形成了标准化的产品线。硅基智能创始人兼CEO司马华鹏表示,目前这部分业务来自于他们自研的“炎帝大模型”以及一个名叫“DUIX”的App完成。
炎帝大模型基于用户提供的人物影像、语音、形象资料进行训练,1:1克隆出具备情感、个性、独有风格的Agent数字人,然后将其绑定在用户的DUIX App账号上,这样就可以通过DUIX App去与数字人进行影像式的实时交互了。
对于“AI复活”这个有些特殊的业务,硅基智能当前并没有去做大范围的宣传和推广,很多是有需求的客户主动找上门来。“公司创立初期,我们有一位联合创始人经历了母亲的离世,在悼念逝者时,这位联合创始人提出,老人不会打字,所以留下了很多语音消息,还有一些照片,提出能不能用AI复活,再和老人说说话?这就是我们做AI复活的契机,也是我们现在一些产品的雏形了。”司马华鹏说。
探秘
影视级数字人难度和成本很高
在聊到技术实现时,几乎所有受访者都认为,所谓“AI复活”其实是当前大热的生成式AI,或者说AIGC领域的一个细分赛道,本质上是利用图像、语音、视频、文字等多个领域中已经成熟的技术去生成个人形象、声音、知识库、思维方式、语言风格等等内容,再逐步将这些不同内容“拼接”成一个完整的产品。
“‘数字复活’是多种AI技术的融合体,很难说其本身存在底层技术上的护城河。可以将其看作是数字人领域的一种应用创新更为准确。”国内数字人底层技术基础设施服务商,数字栩生的CTO翁冬冬这样说。
在具体的实现上,曾经火热到“百模大战”的大模型市场,为AI复活提供了动力。
张泽伟表示,在做那些具有交互功能的AI复活项目时,他们会先收集逝者的生平资料、语言习惯,然后把这些数据输入到服务器上,再基于他们细分领域的一个模型去做本地化的训练和部署。如果用户问到了数据库里没有的信息,底层就会跳转到当前市面上已有的超大模型的付费接口,换文心一言、星火大模型等继续完成对话,这样,就可以持续进行多轮对话。
在这个细分赛道里,“数据”是从业者们频频提起的一个词。
“AI复活对于数据质量的要求非常高,数据越多、越全,训练出来的数字人的相似度就越高。比如如果只是做一个面部驱动,让数字人有面部表情和口型的变化,那其实只要一张照片就行了,但如果要做得很逼真,那就至少需要4-5分钟的一段视频素材。”张泽伟表示。
司马华鹏表示,目前AI复活的难点还是用户是否能提供足够的数据供大模型学习。最优质的数据还是视频,最好是像严伯钧那样的博主,发布过成千上万条蕴含有个人形象出镜、观点输出的视频,其次是大量的文字作品、语音记录、照片等等,而像是社交软件上的浏览记录,例如点赞收藏评论之类的动态作为训练数据而言比较抽象,难以整理,“可能会有一定帮助,但没有那么大”。
由于大模型、生成式AI领域在近一两年的技术热潮,都使得AI复活中对逝者外形、性格、言行举止的模拟、交互对话的实现不再困难,不会像十年前科幻作品里出现时那样,空有概念而无从下手。
不过,如果放到整个数字人领域,其难度和成本又都是“上不封顶”的。在交谈中,翁冬冬提到,像现在很多的“让照片动起来”的效果,其实相关的开源算法研究很多,但其实它能生成的视频是很有限的——可以用算法让照片上的人物说话、让他动起来,但很难让他去做一个转身,或者去做涉及到服装或者环境的变化。
“数字人技术体系是很庞大复杂的,如果是真正的影视级数字人,难度和成本都会很高。”翁冬冬说。
“数字陪伴”也许是目标
在张泽伟看来,2022年底的一波技术大爆发,使得大家都开始探索技术的具体落地和应用,“AI复活”就是应运而生的这样一个产业。而他们也从逐步尝试,到现在整个团队All in这个细分领域。
“作为中小团队,我们其实做不了太多东西,进入到这个领域,也是我们整个团队都觉得它的社会价值和意义比较大。这个行业目前还在早期萌芽阶段,规模很小,短时间或许也难以推进,但观察到国内甚至是全球的庞大的市场需求,我认为未来可能是万亿级别的市场。”张泽伟说。
对于主做AI名人复刻的数字栩生团队来说,目前出于商业方面的考虑,并没有在“AI复活”方面开展什么业务。创始人翁冬冬认为,“AI复活”这个概念本身是有需求的,但现在市面上已有的呈现形式,比如让逝者照片可对话,可能并不是一个特别清晰或者真实的需求。
从长期来说,数字栩生提到了另一个有所重合的概念——数字陪伴。
比起“AI复活”的交付一段视频、一个产品的“短时间内的再次相见”,“数字陪伴”更强调一个有自己的基本逻辑,能长期且深度地去了解被陪伴的人的需求的数字智能体,能作出更合理的反应,提供更加细腻的需求,技术底层类似定制的AI聊天大模型。
要做到这一点,翁冬冬觉得现有的技术可能“不够用”了,基础技术还得再往前走一步才行,比如大模型对于场景的理解能力。
争议
“AI复活”心理疗愈仍无定论 有人认为“伤害比效果更多”
无论是对亲人的缅怀,还是对自身的慰藉,“AI复活”都远比一般的技术场景承担了更复杂的感情。
事实上,“AI复活”于去年刚刚兴起时,就有人认为,这是一种结合了AI的新型心理疗愈方式,将AI技术用在沉湎与亲人分离痛苦中的用户身上,能够缓和他们内心的波澜。
但一位心理咨询师持保留态度。她提出,哀伤有相对固定的过程,承认亲人死亡是很重要的一步,AI复活的片段可能使未亡人丧失现实感,无法完成哀悼,死者那么生动的存在还有可能给未亡人造成二次创伤。而如果模仿得有差错——这又可能从另一种角度“污染”真人原本的回忆,使得死者需要艰难地确认亲人已死,同样可能造成创伤。
还有很多问题暂时无法解决。比如,AI生成内容如果从技术层面被“投毒”,使得最终生成了不受控制的片段呢?使用了“AI复活”的生者是否可能因为社会舆论层面的不理解和偏见,从而产生巨大的精神压力呢?如果用户永远无法面对丧失,反而彻底失去了心理疗愈的可能呢?
法律层面风险无可避免 北上广等探索数字人备案系统
不仅是道德和伦理方面的争议,法律层面的风险同样也无可回避。肖像权侵犯、隐私数据保护、AI诈骗……底层技术的进步也催生出了巨大的灰色地带,“AI复活”甚至于数字人都仍是新兴产业,目前既无专门的监管条例,也没有自发形成的行业标准,因此,从业者们整体都处于审慎探索的状态。
超级头脑团队在进行相关业务时,如果要“复活”逝者,必须由直系亲属提供能证明关系的材料,而如果要“克隆”没有去世的人的数字人形象,必须由本人现场进行声明。
“在‘AI复活’上会存在一些负面反馈,比如部分客户能提供的过世亲人的资料不多,所以最终效果达不到他们的预期。”张泽伟说。
翁冬冬则透露,北京朝阳区已经出台了数字人备案系统,目前正在试运行阶段,相关企业可以将自己生成的数字人拿去系统备案,虽然不具备法律效应,但如果产生版权纠纷时,备案声明能够作为一个证据。上海、广州等地区也在推动类似系统落地,只是背后涉及到版权局、大数据局等多个单位,实际推行起来问题不少。
有意思的是,在展望更长远的未来时,几位受访者都露出了“数字生命派”的身份。其中,翁冬冬纠正道:
“我不认为能像电影《流浪地球》里描绘的一样,直接没有现实肉体,进化到数字生命……我觉得未来可能会通过VR等技术去开拓数字空间的资源,在物理上为人类开拓更大的空间。”
在英剧《黑镜》中,女主利用AI“复活”了男友后,起初欣喜不已,但很快意识到这不过是一个影子。故事的最后,她将仿生的机器人男友搁置在了阁楼,只在每年的特定时间去看他一眼。
在影视作品里,作为人类的终极梦想之一的“死而复生”并不总拥有圆满的结局,而在科技的推动下逐渐走向现实的产业,也仍然存在诸多问题。
也许“AI复活”会在技术的不断发展下大步向前,最终进化到连电影都无法想象的程度,又也许它会在时间的推移里逐渐消散,但在现在,关于未来的畅想已经向我们、向人类打开了大门。
知多D
AI复活
“AI复活”是一类依赖生成式AI的底层技术,复现逝者的形象、声音、言谈举止,甚至是性格情感的产品,业内人更愿意将其描述为“数字陪伴”或“AI数字永生”。
AI复活应用场景
上海超级头脑团队从2015年进入AI游戏开发、VR、数字人等领域,在2023年3月份开始涉足“AI复活”这个崭新的应用场景。当前主要有三类业务:
AI疗愈
呈现形式为通过微信视频的实时通话。团队会基于生成合成类的AI技术克隆相关人物的真实形象、声音,然后再由团队专业的心理咨询导师“换上”这个形象,扮演这个人物与客户进行沟通。这一业务本质是由专业心理咨询师驱动的,结合了AI的一种心理疗愈手段。
数字遗照
呈现形式为搭载了大语言模型且拥有真实人物形象的相册。团队同样基于相关AI技术合成一种数字照片,照片具有真实形象,可以有简单的动作和表情,还可以用逝者的声音进行实时的交流和对话。这一业务本质则是一种软硬件结合的AI聊天机器人。
3D超写实的仿生数字人
底层技术逻辑与第二种基本相同,但最后会以3D的全息舱呈现出来,相当于一个3D建模出来的立体的逝者形象与人进行互动。
采写:南都记者 杨博雯
出品:南都数字经济治理研究中心