关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11854人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

京东集团:子公司达达在内部审计发现存疑行为

中新经纬 浏览 13169

马卡:皇马对本泽马关上回归的大门,他不在俱乐部计划中

直播吧 浏览 13079

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 780

基金跌了 怎么办?大数据告诉你

上海证券报 浏览 26899

久保建英:输球就得回家,要避免像对阵伊拉克一样开场丢球

懂球帝 浏览 12877

"亚洲最帅王子"结婚:婚礼长达10天 李显龙到场观礼

环球人物杂志 浏览 78521

苗青:光伏“破局者”的周期穿越法则

中国企业家杂志 浏览 85

TVB颁奖典礼:佘诗曼黄宗泽拿视帝视后,《新闻女王》成最大赢家

扒虾侃娱 浏览 369

10000亿中芯国际,一剑封喉!

飞鲸投研 浏览 1337

美媒披露:国务院要求各使馆保持缄默

环球网资讯 浏览 15865

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 2097

终于!短剧向经典IP出手了

艳姐的搞笑视频 浏览 1461

银行开始又一轮调降存款利率,负利率来了!

Wind万得 浏览 14736

近5米车长+双电机四驱!深蓝硬派越野SUV入局还有机会吗?

CAR路里 浏览 12778

跑男团到泰国请群演扮粉丝?同一群人举四家灯牌

萌神木木 浏览 17301

插混加持 新款捷途旅行者C-DM本月17日上市

车质网 浏览 1111

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 145

英国以“最高优先级”正式调查社交平台X

新华社 浏览 144

何超欣庆祝24岁生日 奚梦瑶晒合照庆贺

笑猫说说 浏览 16685

曾随海港4次夺冠!33岁名将告别中超 不舍离开将屈尊B队+征战中乙

我爱英超 浏览 270

这次结果如何?切尔西上次在1月换帅后拿了欧冠

懂球帝 浏览 411
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1