关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11932人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小黑靴不流行了?今年冬天最火的靴子竟然是它

LinkFashion 浏览 498

她们说这才是秋天最实用的单品!6种穿法都帮大家总结好了

黎贝卡的异想世界 浏览 1247

韩寒,认真搞钱!

华商韬略 浏览 12773

外交部回应布林肯称"美国将继续做中方不喜欢的事"

外交部网站 浏览 16008

快船出乎意料的丢掉了两个主场,系列赛直接被独行侠打成了大比分2-0!

趣看热点 浏览 25980

联合杯贝尔赫斯首胜阿利亚西姆

体坛周报 浏览 362

台军兵种结构出现大变化 背后的玄机更值得关注

枢密院十号 浏览 15562

怼周鸿祎"翻车"的程前 访谈视频收费几十万

每日经济新闻 浏览 13196

售价为2990元,别克E4哆啦A梦主题套件上市

天天汽车 浏览 12905

达伦-本特:切尔西应该签回弟媳,他看起来依然很出色

懂球帝 浏览 675

朝鲜智库:目前半岛紧张局势不亚于朝鲜战争爆发前夕

环球网资讯 浏览 87260

荷兰弟赞达亚恋情曝光,两人曾在蜘蛛侠中有过密切合作

趣看热点 浏览 28460

夏天穿裙子气质会更好,尤其是这几款

虎哥说衣不二 浏览 19611

天翎科旗舰飞行器L600真机下线,累计获得近千架意向订单|最前线

36氪 浏览 1244

利文斯顿谈当年重伤:4根韧带撕裂3根 医生把这当成车祸&谈论截肢

直播吧 浏览 16676

《阿凡达3》第一波真实口碑,国内票价令人咋舌

娱乐圈笔娱君 浏览 706

特斯拉 × 百度地图 V20 实测视频公布:支持 3D 车道导航等

IT之家 浏览 11610

男子夜钓遭枪击 家属:行凶者把猎枪扔河里 警方找7天

扬子晚报 浏览 5383

记者:默郡警方安监控,严防利物浦vs曼城一战有人闹事

直播吧 浏览 12405

热火总决赛还剩最后一张牌:是时候让希罗G4复出了

罗说NBA 浏览 17424

迪士尼被曝将继续裁员4000人,2月宣布公司战略重组

澎湃新闻 浏览 19546
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1