关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11192人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

配全新双联屏 红旗HS6 PHEV将11月15日预售

车质网 浏览 496

Vision Pro被科技博主吹爆,却难掩四大致命硬伤,初代产品谨慎买

雷科技 浏览 16304

一文看懂副业真相,斜杠青年赚钱吗?

钛媒体APP 浏览 15998

各界人士送别著名计算机科学家汤晓鸥

澎湃新闻 浏览 12587

秦刚外长抵达新德里 一场重大的多边外交拉开帷幕

环球网资讯 浏览 18907

[小鲨帮选车]不到201.60万大型车,值不值得买

专研试驾 浏览 12671

汽车降价潮调查:政府补贴含金量高,车企让利并不多

红星资本局 浏览 18804

乌称1200名乌被俘人员将获释 俄方暂无回应

新京报 浏览 370

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 5600

网购手机收到苹果味酸酸乳续:盗窃包裹嫌犯被抓获

澎湃新闻 浏览 26783

王传君拿下东京电影节影帝!撕奖过程太精彩,连坑两位中国女星

萌神木木 浏览 566

“长安系”再落关键子:王辉亲掌阿维塔董事长

网易汽车 浏览 1480

苹果折叠屏iPhone Fold细节曝光:钛合金机身,售价超2000美元

IT之家 浏览 1433

长春高新“灵魂人物”离婚!曾套现62亿,天价离婚什么信号?

侃见财经 浏览 12462

大众德国沃尔夫斯堡工厂取消生产ID.3:需求低迷所致

IT之家 浏览 11079

马斯克与美国证交会达成协议 将向投资者赔偿4000万美元

财联社 浏览 14237

开年第一神作,豆瓣8.7低了

独立鱼 浏览 12769

美防长被传命殒基辅 媒体:消息源自知名假新闻网站

澎湃新闻 浏览 12785

俄学者:今年参与阅兵坦克不太多 现在不是庆祝的时候

上观新闻 浏览 119808

萨哈:桑乔是曼联最失败的引援之一,他觉得自己凌驾于教练之上

直播吧 浏览 12384

继续休假!赵继伟赶赴复旦与球迷切磋,现场百人观战,事后狂签名

篮球资讯达人 浏览 16166
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1