关闭广告

碾压GPT-4!DeepMind CEO自曝:下一代大模型将与AlphaGo合体

新智元6373人阅读


新智元报道

编辑:编辑部

【新智元导读】谷歌DeepMind CEO Hassabis全新爆料:全新Gemini模型将结合进AlphaGo和大语言模型,成本预计是数千万美元,甚至数亿。

谷歌,是真的破釜沉舟了。

传说中合并了AlphaGo和类GPT-4大模型的Gemini,终于要来了吗?

一个是用强化学习击败人类围棋冠军、创造历史的AI系统,一个是目前霸榜几乎所有大模型榜单、一骑绝尘的最强多模态大模型,两个AI一合体,简直要无敌了!


谷歌DeepMind CEO Hassabis近日对外媒Wired表示,Gemini还在开发中,还需要几个月,而谷歌DeepMind已经准备砸进数千万美元,甚至数亿。

此前,Sam Altman曾透露,创建GPT-4的成本超过了1亿美元。谷歌DeepMind,当然也不能输。


太长不看版

Gemini会将AlphaGo与GPT-4等大模型的语言功能合并,系统解决问题和规划的能力将大大增强。

  • Gemini是一个大语言模型,类似于 GPT-4

  • 预计花费数千万到数亿美元,与开发GPT-4的成本相当

  • 除了AlphaGo,还会有别的创新

Gemini会整合使用了强化学习和树搜索的AlphaGO。

  • 强化学习允许AI通过从反复尝试和反馈中学习,解决挑战性难题

  • 树搜索方法有助于探索和记住场景中可能的移动,比如在游戏场景中

DeepMind在强化学习方面的丰富经验,会为Gemini带来崭新功能。

  • 其他领域技术(如机器人和神经科学)也会整合到Gemini中

下一个算法,要超越ChatGPT

根据OpenAI CEO Sam Altman的说法,GPT-5距离发布尚有时日,至少6个月内不会开始训练。而Gemini的发布时间尚未确定,可能在几个月之内。


尚在开发中的Gemini,也是一个处理文本的大语言模型,性质上和GPT-4类似。

但谷歌DeepMind CEO Demis Hassabis表示,Gemini会结合进AlphaGo中使用的技术,这将赋予系统全新的规划、解决问题的能力。

2016年,AlphaGo击败围棋世界冠军李世石的那一幕,如今依然历历在目。


Hassabis表示,「可以这么说,Gemini把AlphaGo系统的一些优势,和大语言模型惊人的语言能力结合在一起了。并且,我们还有一些其他有趣的创新。」

据说,Gemini具有以前模型中没有的多模态功能,在集成工具和API方面非常高效。而且,Gemini将提供多种规模,旨在支持未来内存和规划上的创新。

在三月份,曾经有这样一个说法:Gemini会像GPT-4一样,具有一万亿个参数。而且,据说Gemini将使用数以万计的谷歌TPU AI芯片进行训练。


在上个月的谷歌开发者I/O大会上,谷歌就曾提到,从一开始,Gemini的目标就是多模态、高效集成工具、API。

而当时谷歌的预告是:「虽然还在早期,但我们已经在Gemini中,看到了在之前的模型中从未见过的多模态能力,这让人印象太深刻了。」

AlphaGo背后的技术,就是强化学习,这是DeepMind首创的技术。


RL代理随着时间的推移与环境交互,通过反复试验来学习策略,从而最大限度地提高长期累积奖励

通过强化学习,AI能够通过反复尝试和接受反馈来调整自己的表现,因而学会处理很棘手的问题,比如在围棋或电子游戏中选择如何采取下一步行动。

另外,AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法,来探索和记住棋盘上所有可能的动作。


这已经不是Hassabis第一次搅动起科技巨头的大规模人工智能淘金热了。

2014年,DeepMind使用强化学习,让AI学会了玩简单的视频游戏,这一成果惊为天人,直接让DeepMind被谷歌收购。

谷歌的注果然押对了。

接下来几年,DeepMind隔一段时间就产出一个惊艳全世界的成果。


深度学习和强化学习正在解决许多经典的人工智能问题,例如逻辑、推理和知识表示

2016年,石破天惊的AlphaGo,直接点燃了深度学习和第一轮AI产业的热潮。

2017年,AlphaGo Zero没有使用人类数据,就迅速超越了AlphaGo。


AlphaGo Zero

2020年,AlphaFold对于蛋白质结构的预测与实验室技术相当,基本解决了蛋白质的折叠问题。

今年6月,AlphaDev创造全新的排序算法,或将彻底改变计算机科学的效率和成果。

相比OpenAI更通用的路线,DeepMind多年来深耕垂直领域。

语言模型的下一个重大飞跃在哪里?Gemini或许指引了下一代语言模型的方向。

背水一战

很明显,Gemini是谷歌的背水一战。

谷歌开创的许多技术,比如Transformer架构,让最近的AI洪流成为可能。

因为对于技术的开发和部署太过谨慎,在ChatGPT和其他生成式AI构成的竞争面前,它反而显得暂时落后。

为了对打ChatGPT,谷歌连续抛出多个动作,比如推出Bard,并且将生成式AI集成到搜索引擎和其他产品中。


为了集中力量办大事,在4月,谷歌干脆把Hassabis的DeepMind和谷歌的主要人工智能实验室谷歌大脑合并,合体为谷歌DeepMind。

对于合体后的全新团队,Haasabis显然非常自信。他表示,全新的团队汇集了两股对最近的人工智能进步至关重要的力量。

「如果你看看我们在人工领域的位置,你会相信,未来80%或90%的创新,就会来自其中一个团队。在过去十年里,两个团队都做出了极其出色的成果。」

新的想法

训练像OpenAI的GPT-4这样的大型语言模型,需要将来自书籍、网页和其他来源的大量精选数据集的输入「Transformer」中。

Transformer使用训练数据中的模式来熟练预测后续文本中应该出现的每一个字母和单词。

这种看似简单的机制,却在回答问题和生成文本或代码方面非常强大。

但这个看似简单的技术原理也被很多行业大佬或者人工智能专家们诟病。


马斯克:目前AI技术的本质就是统计学


OpenAI在GPT系列模型上的突破,就是在Transformer的核心技术之上,很激进地采用了RLHF来强化模型的能力。

而DeepMind在强化学习方面同样有非常丰富的经验。

这就让人有非常充足的理由期待Gemini在未来可能会展现出来的创新能力。


更加关键的是,Hassabis和他的团队也会试图用人工智能其他领域的核心技术来增强大型语言模型的能力。

DeepMind的技术积累非常广泛。

从机器人技术到到神经科学,他们武器库里有各种各样的装备可供他们挑选。


比如像LeCun这样的AI大佬就表示,Transformer将语言模型的能力过度限制在了文本的范围之内。

像人类和动物⼀样,从世界的物理经验中学习可能才是发展人工智能的最优解。

也许在Gemini身上,人工智能将展示出其他方向的潜力。

不确定的未来

Hassabis的任务是加速谷歌的人工智能技术的发展,同时管理未知和潜在的严重的风险险。

大语言模型的飞速进步让许多人工智能专家开始担心这项技术是否会打开潘多拉的魔盒,让人类社会付出无法接受的代价。

Hassabis表示,人工智能可能给人类社会带来的收益不可估量。

人类必须要持续发展这项技术。


强制暂停发展AI技术完全没有可操作性。

但是这并不意味着Hassabis和他领导的DeepMind会不计后果地推进技术的发展。

毕竟,谷歌和DeepMind之所以把AI技术的领袖位置拱手让给OpenAI。

很大一部分原因就是对待AI发展采用了「过于负责任」的态度。

网友:不看好

但是对于未来Gemini的发布,因为考虑到之前谷歌保守的态度,大部分网友似乎都不太看好。


你们觉得这个类似于AGI的模型会在什么时候发布呢?


我赌10块谷歌永远不会发布这个东西。


如果有人关注过谷歌的项目的话,就会发现,他们一般都是先吹一阵牛,然后什么也不发布,一年后再把这个项目给砍了。

不过,对于谷歌在目前大语言模型中做的贡献,网友还是很认可的。


网友A:OpenAI用的大语言模型技术基本都是谷歌发明的

网友B:是的,不过特斯拉发不了财,但是爱迪生可以。


这位网友就很看好DeepMind将利用自己在强化学习方面的经验能在大语言模型上产生的突破。

不过他依然认为可能谷歌只会用改进自己现有产品的思路来推进这个技术,而不是推出全新的产品。

参考资料:

https://the-decoder.com/deepmind-founder-shares-details-on-gemini-googles-next-gen-response-to-gpt-4/

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全面!斯玛特全场20中9得到25分6板8助3断 助攻抢断均全场最高

直播吧 浏览 3584

又飒又美的“大女人”穿搭,适合40多岁女人借鉴,谁穿谁优雅

静儿时尚达人 浏览 1678

张柏芝现身巴黎受追捧笑容满面 生图状态引争议

缘木不求娱 浏览 6198

星光大赏红毯 女明星撞衫摔跤流鼻血

萌神木木 浏览 3777

这位“AI教父”怎么总炮轰ChatGPT?

36氪 浏览 5907

小伙提醒醉酒房客小声点遭踹门闯入殴打 警方认定互殴

上游新闻 浏览 25077

你不知道的《城市猎人》幕后冷知识_是王晶与成龙首次也是唯一一次合作

趣看热点 浏览 17256

微众银行杨强:AI Agent是大模型面向应用端发展的下一阶段

网易科技报道 浏览 1303

波点裙,现在穿美的很过分!

Yuki女人故事 浏览 1639

自然脸和"打针脸"区别有多大?3组高颜值明星对比

小故事娱乐 浏览 9816

华为再发30亿中票,支撑关键战略落地!国内成融资主场

证券时报 浏览 4808

春夏就得穿裙子 这22条太美了!

春菇凉时尚穿搭记 浏览 10138

女孩在高铁遭掌掴后还击被认定为"互殴" 司法部发声

都市快报橙柿互动 浏览 65670

这些不经意的发现,可能会颠覆你对人类文明的认知

趣看热点 浏览 15755

坏消息!美国一致同意禁止中国使用AI服务

浏览 1415

2023年夏季越看越爱的流行妆容!

猫姐品衣有道 浏览 7355

美舰过航台湾海峡 解放军全程跟踪监视

东部战区 浏览 3068

打得不错!威少半场5中3得到7分1篮板2助攻1抢断

直播吧 浏览 3667

白宫回应客机坠毁事故:出动6架F-16战机拦截

环球网资讯 浏览 7600

ChatGPT写的故事书,已经在亚马逊开卖了

字母榜 浏览 9988

网站曝光阿根廷2024年主场球衣:传统蓝白条纹+金色三星队徽

直播吧 浏览 7041
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1