关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10839人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今夏推荐这25双凉鞋 时髦又有型!

仙爷种草机 浏览 16353

美媒披露普京停火条件:基辅必须彻底放弃顿涅茨克

参考消息 浏览 353

姚晨:自然予我

时尚COSMO 浏览 1172

美防长患前列腺癌瞒着拜登 专家:其并发症很罕见

新京报外事儿 浏览 11985

AI会取代考古学家吗?在这场沙龙中窥见人工智能对文保利用的影响

封面新闻 浏览 432

今年流行“一刀切”发型 好打理又轻盈

成铭聊发型 浏览 19040

《大话西游》中朱茵扮演了青霞和紫霞,可是很多人都不知道她还在里面扮演了猪八戒

趣看热点 浏览 27472

陈赫持股贤合庄被列入经营异常 其为第一大合伙人

网易娱乐 浏览 18926

要摊牌邮报:桑乔将与滕哈赫直接对话,有人认为滕帅优待安东尼

直播吧 浏览 13671

娱乐圈画传2023:宇宙很大,生活更大

网易娱乐专稿 浏览 12791

聊聊全新奥迪A6L 也许豪华行政市场要换风向了

网易汽车 浏览 510

年过40岁的女人,过年的时候这么穿,亲戚朋友见了都夸赞不已

静儿时尚达人 浏览 12624

梅西直播首秀现场曝光!迷弟苏醒赶去现场拍合照

萌神木木 浏览 15546

孙铭徽赛季总助攻307次继续领跑国内球员榜 赵继伟居次&高诗岩第3

直播吧 浏览 18845

亚马逊大裁员后又暂停第二总部建设,降本增效这么艰难?

第一财经资讯 浏览 18436

记者问美防长戴"俄国旗颜色领带" 五角大楼:你妈买的

环球网资讯 浏览 5071

《红舞鞋》风波升级!用脚踩烈士纪念碑还撞死猫,劣迹斑斑遭抵制

萌神木木 浏览 313

针对伊朗,以色列搞了次“内阁战争演习”

参考消息 浏览 16325

史上最强性能,Abarth首款纯电车型谍照曝光

天天汽车 浏览 11888

引入阿布扎比巨额投资后,李斌将不再是蔚来最大股东

华尔街见闻官方 浏览 12601

恭喜,40+的她终于被拉下神坛

独立鱼 浏览 12273
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1