关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11712人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"2500吨粮食没法及时运出去" 一根限高杆卡住四个村

重案组37号 浏览 10651

Skip:泰伦-卢是NBA最佳教练 但他新赛季仍无法带威少赢球

直播吧 浏览 15909

足球报:下一个可能退出的大概率是河北队,球队冬训靠球员自费

直播吧 浏览 19807

付笛生儿子在欧洲演出!夫妻俩打扮朴素甜蜜约会

盖饭娱乐官方号 浏览 15241

京东新设一级部门攻坚线下零售,生活服务事业部被拆分

雪豹财经社 浏览 16146

十几位主播围住96岁摆摊奶奶蹭流量,网友直呼疯子们饶了奶奶吧!

趣看热点 浏览 26334

第37届电影百花奖来了,看完提名名单,我要说:内娱影坛要完了!

娱乐圈笔娱君 浏览 11072

吉利豪越系列新成员曝光 豪越PRO将于1月上市

网易汽车 浏览 13165

故障不断!波音“吃人的飞机”再现?

大猫真探社 浏览 13001

AI大佬Karpathy焦虑了:作为程序员,我从未感到如此落后

机器之心Pro 浏览 256

以色列宣布:将扣押的数百名活动人士驱逐出境

环球时报国际 浏览 1335

李嫣逛街故意遮住脸 穿长裙皮肤白皙亭亭玉立

素素娱乐 浏览 20123

“不响”的尚雯婕,也是浪漫主义的疯子

仙女事件簿 浏览 13079

重要信号,楼市将变!

博闻财经 浏览 586

西安一小区楼体开裂路面塌陷 维修需花费近百万

上游新闻 浏览 90799

仅上任两个月!某车企董事长突然辞职

汽车工程师 浏览 103

狗仔曝司晓迪靠代付过活,加一起才962块,狗仔被网友骂到破防!

萌神木木 浏览 28

马斯切拉诺:我对穆勒的记忆并不美好;希望运气在我们这边

懂球帝 浏览 597

曾志伟儿子曾国祥执导的电影《少年的你》入围今届奥斯卡最佳国际电影的最后5强

趣看热点 浏览 26974

曾凡博等多人生病缺席!北京末节崩盘难阻深圳5连胜 范子铭24+9

醉卧浮生的体育世界 浏览 19676

中国2023年12月规模以上工业增加值同比增长6.8%

国家统计局 浏览 13141
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1