关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11572人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

福克斯10投1中国王惨败!一度落后鹈鹕50分

OnFire 浏览 12786

中国留学生在新西兰被女子用长铁棍捅脸 老人挺身相救

红星新闻 浏览 64498

红布林618升级用户体验:回收加价17%、零手续费

网易科技报道 浏览 16801

为明年的 iPhone 设计的“A20”芯片价格可能会大幅上涨

威锋网 浏览 1018

锁定汽车行业不知高考志愿如何填?这篇万字长文深度解读请收好!

二师兄玩车 浏览 11100

马克龙密会AI专家,法国加入全球人工智能竞赛

环球网资讯 浏览 16314

萨姆·奥特曼:人类水平的AI即将出现 但对世界的影响远比想象的小

网易科技报道 浏览 12971

活塞99-98险胜老鹰,杜伦21分11板,杰伦-约翰逊空砍29+13

懂球帝 浏览 488

外媒称全球可用核武库增长 炒作中国核弹数量大增

环球网资讯 浏览 16382

8年青春换来丈夫出轨,如今张嘉倪让前夫高攀不起

画画影视 浏览 98

养老金增速领跑 险资投资版图更新

北京商报 浏览 573

文班谈明年回家乡打巴黎赛:这将是我生命中最激烈&珍贵的比赛之一

直播吧 浏览 13084

河南有强奸前科老人猥亵幼女获刑2年 受害人家属发声

极目新闻 浏览 6280

种粮大户给农民发1169万年终奖 "种粮状元"获超31万元

极目新闻 浏览 75968

短发才是打开夏天的正确方式 这几款时尚又显年轻

成铭聊发型 浏览 17540

超80部电影定档,2024暑假档成龙沈腾马丽神仙打架,谁能成黑马?

毒舌电影 浏览 10812

开工第一天被曝遭解散,高合汽车真的不行了?

盖世汽车 浏览 12265

报告称机械硬盘价格触底反弹,平静2年后将迎新一轮涨价潮

IT之家 浏览 270

英国斥巨资挂查尔斯肖像

环球时报国际 浏览 12468

瑟尔斯基被任命为乌武装部队总司令

央视新闻客户端 浏览 12885

2000万亿!史无前例的泡沫破裂!

米筐投资 浏览 1137
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1