关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11952人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

38岁的陈伟霆急了!和何穗续缘后疑是好事将近

娱乐白名单 浏览 13185

史上头次只有6人拍总决赛合照,ATP骚操作引球迷众怒:德约呢?

网球之家 浏览 1287

酷态科首款户外电源亮相,还有充电宝充电器二合一产品

IT之家 浏览 1601

看北京退休奶奶的打扮才发现:发不染、裙及踝、裤穿宽,优雅得体

潮人志Fashion 浏览 13899

杨澜晒护照否认移民传闻:我一直都是中国公民

网易娱乐 浏览 19383

理查兹:道曼和萨卡位置重叠,为球员未来发展应该将他外租

懂球帝 浏览 1251

迷雾剧场新剧:超越悬疑,窥见人心

吐槽电影院 浏览 1408

“马丁靴”输惨了!冬天穿这3双巨洋气

In风尚 浏览 14171

“史上最长”春节点燃旅游热情 已有心急旅客下单

新京报 浏览 6552

达成停火18天后战火再起 以总理下令袭击加沙

国际在线 浏览 1341

贝莱林:温格视足球为艺术,阿尔特塔和他就如同一枚硬币的两面

直播吧 浏览 2168

露笑科技百亿碳化硅项目调查:屡次延期,厂区清冷如“空城”

时代周报 浏览 141

万科A:第三季度净利润亏损160.69亿元

网易财经 浏览 1148

广汽功臣肖勇让位,埃安、杨龙能否相互成全?

车友观察 浏览 2227

将“简单款”穿出高级感的女人,我只服她们,年过四十也优雅

静儿时尚达人 浏览 11961

衣服穿对不穿贵,这些才是最适合普通人的穿搭,优雅又简约

静儿时尚达人 浏览 1070

这4款配饰 才是多巴胺穿搭的减龄秘诀

LinkFashion 浏览 16540

俄大使披露:美军控制马杜罗时 没打算让任何人活下来

扬子晚报 浏览 4825

尚水智能三度试水A股终迎曙光 比亚迪十亿关联交易护航IPO闯关

叩叩财讯 浏览 744

拜登发表"一生中最好的演讲" 众议长在身后摇头翻白眼

环球网资讯 浏览 83434

周定洋告别成都蓉城:人生最艰难决定!在对的时间开启新挑战

奥拜尔 浏览 321
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1