关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10615人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

百亿之后,珀莱雅失速

斑马消费 浏览 175

天价车祸 法拉利恩佐德国高速遭遇重大事故 二手价超千万元

智车情报局 浏览 11618

开年第一瓜!知名男星被曝欠钱不还,劈腿打人

不八卦会死星人 浏览 11707

院士:不认同对院士贿选的指控,谁能搞定百余位院士?

why星人 浏览 15433

张庆鹏:很需要一场主场胜利来回报球迷 祝福我的队员健健康康

直播吧 浏览 18586

网易高管解读2023 Q2财报:加大研发投入,持续打造内容爆款

网易科技报道 浏览 13362

陈可辛官宣新电影女主角是章子怡 工作室修图太狠

萌神木木 浏览 15500

土媒:伊卡尔迪优先考虑重返意甲,无法成行才会选择土超

直播吧 浏览 18245

哈维尔:泰山队身体占优让我们很不适应 客场拿到1分可以接受

直播吧 浏览 14753

三亚游客:托车回成都排到下月 无奈选择“人走车留”

封面新闻 浏览 79272

2021NBA全明星第一轮投票结果出炉,杜兰特力压詹姆斯成票王

趣看热点 浏览 24754

俄军近乎包围巴赫穆特 乌军指挥官称前线"像地狱"

澎湃新闻 浏览 100850

Windhorst:多队对骑士阿伦兴趣浓厚 但阿特金森想留下昔日爱徒

直播吧 浏览 9706

福特烈马增程版申报信息曝光: 1.5T增程+弗迪电池

网易汽车 浏览 181

热火总决赛还剩最后一张牌:是时候让希罗G4复出了

罗说NBA 浏览 16125

14分9板20助!哈登:我得分效率不高 所以得找其他方式影响比赛

直播吧 浏览 18580

比亚迪的智能化“梦想日”,到底有没有“王炸”?

钛媒体APP 浏览 11876

买珠宝像买糖果,这位亚裔名媛因奢华挥霍走红

外滩TheBund 浏览 15926

今年最流行的4双鞋,配西装时髦有态度!

LinkFashion 浏览 719

OpenAI删除了禁止其技术被用于军事用途的条款

环球时报新闻 浏览 76254

Lisa与法国第一夫人同框!行头超7万,双膝跪地很卑微被嘲是玩具

文艺圈娱乐号 浏览 12229
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1