关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10816人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“我一次一次被他们骗!”男子在杭州买高合汽车被气炸,迟迟不交车,2万定金也要不回......

都市快报橙柿互动 浏览 11759

巴媒:巴西后腰马修斯-尤萨正与上海海港进行谈判

直播吧 浏览 12162

以方称已提交一份撤离加沙地带平民的行动计划

财联社 浏览 11646

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 415

购置税红利倒计时,头部车企上演“兜底”大战

汽车点评AC 浏览 137

德天空:法比奥-卡瓦略冬窗会离开布伦特福德,可能永久转会

懂球帝 浏览 142

记者:海港抵达武里南,莱昂纳多、加布、李帅、刘若钒伤缺

懂球帝 浏览 10

火箭不敌公牛连跌2位到西部第10 太阳和湖人分别“躺”升1位

直播吧 浏览 12148

创纪录防卫预算,日本花在哪?

环球网资讯 浏览 12216

德泽尔比:对阵阿森纳会展现实力,你们将看到真正的布莱顿

直播吧 浏览 17979

方寸间也能尽显时尚品味?系条丝巾试试

时装LOFFICIEL杂志 浏览 18667

思辨之夏|丁磊、史喆:训练1个ChatGPT要多少钱?

网易财经智库 浏览 15727

特谢拉埃德尔爆粗苏宁:张近东就是骗子 欠的钱呢

东方体育日报 浏览 25562

省委书记、省长等18位省领导 一下火车直奔企业车间

政知新媒体 浏览 5547

相同的3nm工艺:天玑9500要比第五代骁龙8至尊版便宜50%以上!

快科技 浏览 434

记者:国足亚洲杯训练场也是阿根廷队2022年世界杯大本营场地

直播吧 浏览 12094

米兰未来3-0斯坎佐罗夏特,伊布儿子为米兰未来首开记录

懂球帝 浏览 864

日企将用高空气球把乘客送至25公里高空开启太空游 票价12万元

网易科技报道 浏览 18947

第三届CATA航空大会在京举办

北京商报 浏览 209

李嘉欣晒儿子近照:12岁许建彤长高许多长相成熟

笑猫说说 浏览 14436

39集《沉默的荣耀》大结局前瞻,5人再无反转,黎晴成唯一变数

娱乐圈笔娱君 浏览 401
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1