关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11988人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张雨绮爆雷丢工作!省媒确认她不会上春晚

FancyMusic 浏览 8

这些知识女性的衣橱,完全不输穿搭博主

黎贝卡的异想世界 浏览 1248

小米SU7凌晨突发撞击事故 车辆爆燃施救人员未打开车门

网易汽车 浏览 1587

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 1543

法国农民展开"巴黎围城" 粮农放话:让巴黎人挨饿

环球时报国际 浏览 80393

今年最狠悬疑剧,好人为何集体沉沦?

仙女事件簿 浏览 1458

加速虹吸,东方之珠的货币抽水机……

杨国英观察 浏览 11778

日本外务大臣:将探讨邀请泽连斯基出席G7广岛峰会

界面新闻 浏览 19734

日本球迷惊呆:中国队4场1球进了4强? 刘建宏:我们愿一直苟着?

风过乡 浏览 272

那些年王室贵族新娘穿过的Elie Saab婚纱

欧洲王室八卦 浏览 17700

每天干十几个小时,月赚五六千元,有人6万元盘下,几个月后2万多才脱手!曾经爆火的创业项目遭嫌弃

都市快报橙柿互动 浏览 316

这条裙子又火了!穿得花一点才好看

LinkFashion 浏览 12302

国产英伟达88天闯关IPO!

诗与星空 浏览 2015

刷新吉尼斯记录!长安启源A07成功挑战最高海拔差

车观察全景 浏览 13045

美国芝加哥极寒下惊现“特斯拉坟场”!车主:我们这里有一堆死去的机器

红星新闻 浏览 12767

万项:距离理想中的球员还差很多;最后两场比赛不会放松

懂球帝 浏览 967

张子宇加盟首次未登场:前两场正负值均最差 山东女篮加时胜江苏

醉卧浮生 浏览 398

周也你怎么两副面孔?

伊周潮流 浏览 12301

中央军委副主席何卫东和多名军队院士见面

政知新媒体 浏览 13509

美财长称中国是"不可靠的伙伴" 外交部回应

澎湃新闻 浏览 14377

巴西发起最致命反毒行动:致121人死亡 头号头目逃脱

红星新闻 浏览 7775
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1