关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11978人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加速虹吸,东方之珠的货币抽水机……

杨国英观察 浏览 11769

媒体:怒批欧洲软弱 结果特朗普自己成"吐槽大会"主角

新京报评论 浏览 17902

拉塞尔近10战场均26.2分&三分49.5% 在此之前14.6分&38.3%

直播吧 浏览 12951

罗欣药业聘任前基金经理当董秘,刚抛出8.42亿元定增,加码原料药和创新药

红星资本局 浏览 1562

怒批9人摆烂!穆帅不惧球员造反:你爸一直对你好? 4轮0分非末日

风过乡 浏览 1066

吴速玲曝儿子Joe是恋爱脑

韩小娱 浏览 354

宋慧乔怎么不会老啊?

时尚COSMO 浏览 892

广东U20 1-0上海U20,张志雄绝杀

懂球帝 浏览 1226

预售权益价10.69万元起 东风日产N6将上市

网易汽车 浏览 1197

最近《美人鱼2》补拍镜头完成,预计今年将选择合适的档期上映

趣看热点 浏览 27140

越级空间 长安启源A06上市售10.99万元起

网易汽车 浏览 1231

辉瑞将对孕妇展开新冠疫苗试验到底是怎么回事?

趣看热点 浏览 25825

毛不易演唱会撒圆形纸钱,本人:这吉祥吗?

一家说 浏览 2126

配全新双联屏 红旗HS6 PHEV将11月15日预售

车质网 浏览 1284

"特朗普黄金卡"正式接受申请 从500万降至100万美元

国是直通车 浏览 17685

"最恨踢假球"的李铁栽了 足坛落马人员被查前屡唱高调

上游新闻 浏览 75314

综合续航超1400公里 奇瑞风云T9是你的菜吗?

汽车经纬网 浏览 13614

“女足活力玫瑰课堂”走进乡村校园,刘青、李琳等球员参与

懂球帝 浏览 14188

跨年档票房惨淡!5部新片全部倒挂,《寻秦记》情怀满满却难回本

萌神木木 浏览 543

在美流浪博士曾月薪10万美元:前妻拿到绿卡后和他离婚

上观新闻 浏览 74842

美媒:中国达沃斯代表团阵容庞大 美国外交部很不安

直新闻 浏览 76651
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1