关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11854人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

京东集团：子公司达达在内部审计发现存疑行为

中新经纬浏览 13169

马卡：皇马对本泽马关上回归的大门，他不在俱乐部计划中

直播吧浏览 13079

地平线苏箐：3年后准L4级系统大概率已经量产

网易汽车浏览 780

基金跌了怎么办？大数据告诉你

上海证券报浏览 26899

久保建英：输球就得回家，要避免像对阵伊拉克一样开场丢球

懂球帝浏览 12877

＂亚洲最帅王子＂结婚：婚礼长达10天李显龙到场观礼

环球人物杂志浏览 78521

苗青：光伏“破局者”的周期穿越法则

中国企业家杂志浏览 85

TVB颁奖典礼：佘诗曼黄宗泽拿视帝视后，《新闻女王》成最大赢家

扒虾侃娱浏览 369

10000亿中芯国际，一剑封喉！

飞鲸投研浏览 1337

美媒披露：国务院要求各使馆保持缄默

环球网资讯浏览 15865

新季各队最令人期待球员中部篇内姆哈德追逐MIP？

体坛周报浏览 2097

终于！短剧向经典IP出手了

艳姐的搞笑视频浏览 1461

银行开始又一轮调降存款利率，负利率来了！

Wind万得浏览 14736

近5米车长+双电机四驱！深蓝硬派越野SUV入局还有机会吗？

CAR路里浏览 12778

跑男团到泰国请群演扮粉丝?同一群人举四家灯牌

萌神木木浏览 17301

插混加持新款捷途旅行者C-DM本月17日上市

车质网浏览 1111

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技浏览 145

英国以“最高优先级”正式调查社交平台X

新华社浏览 144

何超欣庆祝24岁生日奚梦瑶晒合照庆贺

笑猫说说浏览 16685

曾随海港4次夺冠！33岁名将告别中超不舍离开将屈尊B队+征战中乙

我爱英超浏览 270

这次结果如何？切尔西上次在1月换帅后拿了欧冠

懂球帝浏览 411

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

马克龙密会A...

美政府＂停摆...

小伙7年后与...

期货所手续费...

过时的拍照姿...

一则关注函，...

阿门-汤普森：从小一直看球每年都买联盟通它有点偏贵

马斯克：完成芯片设备植入人类大脑！脑机接口距离健康人还有多远？

库里三分大赛31分再夺冠军，创造NBA全明星赛多项历史新纪录

京东集团：子公司达达在内部审计发现存疑行为

马卡：皇马对本泽马关上回归的大门，他不在俱乐部计划中

地平线苏箐：3年后准L4级系统大概率已经量产

基金跌了怎么办？大数据告诉你

久保建英：输球就得回家，要避免像对阵伊拉克一样开场丢球

＂亚洲最帅王子＂结婚：婚礼长达10天李显龙到场观礼

苗青：光伏“破局者”的周期穿越法则

TVB颁奖典礼：佘诗曼黄宗泽拿视帝视后，《新闻女王》成最大赢家

10000亿中芯国际，一剑封喉！

美媒披露：国务院要求各使馆保持缄默

新季各队最令人期待球员中部篇内姆哈德追逐MIP？

终于！短剧向经典IP出手了

银行开始又一轮调降存款利率，负利率来了！

近5米车长+双电机四驱！深蓝硬派越野SUV入局还有机会吗？

跑男团到泰国请群演扮粉丝?同一群人举四家灯牌

插混加持新款捷途旅行者C-DM本月17日上市

《麻省理工科技评论》发布2026年“十大突破性技术”

英国以“最高优先级”正式调查社交平台X

何超欣庆祝24岁生日奚梦瑶晒合照庆贺

曾随海港4次夺冠！33岁名将告别中超不舍离开将屈尊B队+征战中乙

这次结果如何？切尔西上次在1月换帅后拿了欧冠

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

马克龙密会A...

美政府＂停摆...

小伙7年后与...

期货所手续费...

过时的拍照姿...

一则关注函，...

阿门-汤普森：从小一直看球 每年都买联盟通 它有点偏贵

马斯克：完成芯片设备植入人类大脑！脑机接口距离健康人还有多远？

库里三分大赛31分再夺冠军，创造NBA全明星赛多项历史新纪录

京东集团：子公司达达在内部审计发现存疑行为

马卡：皇马对本泽马关上回归的大门，他不在俱乐部计划中

地平线苏箐：3年后 准L4级系统大概率已经量产

基金跌了 怎么办？大数据告诉你

久保建英：输球就得回家，要避免像对阵伊拉克一样开场丢球

＂亚洲最帅王子＂结婚：婚礼长达10天 李显龙到场观礼

苗青：光伏“破局者”的周期穿越法则

TVB颁奖典礼：佘诗曼黄宗泽拿视帝视后，《新闻女王》成最大赢家

10000亿中芯国际，一剑封喉！

美媒披露：国务院要求各使馆保持缄默

新季各队最令人期待球员中部篇 内姆哈德追逐MIP？

终于！短剧向经典IP出手了

银行开始又一轮调降存款利率，负利率来了！

近5米车长+双电机四驱！深蓝硬派越野SUV入局还有机会吗？

跑男团到泰国请群演扮粉丝?同一群人举四家灯牌

插混加持 新款捷途旅行者C-DM本月17日上市

《麻省理工科技评论》发布2026年“十大突破性技术”

英国以“最高优先级”正式调查社交平台X

何超欣庆祝24岁生日 奚梦瑶晒合照庆贺

曾随海港4次夺冠！33岁名将告别中超 不舍离开将屈尊B队+征战中乙

这次结果如何？切尔西上次在1月换帅后拿了欧冠

阿门-汤普森：从小一直看球每年都买联盟通它有点偏贵

地平线苏箐：3年后准L4级系统大概率已经量产

基金跌了怎么办？大数据告诉你

＂亚洲最帅王子＂结婚：婚礼长达10天李显龙到场观礼

新季各队最令人期待球员中部篇内姆哈德追逐MIP？

插混加持新款捷途旅行者C-DM本月17日上市

何超欣庆祝24岁生日奚梦瑶晒合照庆贺

曾随海港4次夺冠！33岁名将告别中超不舍离开将屈尊B队+征战中乙