关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11234人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

三季报丰收伴管理层大换血,洛阳钼业高光背后为何求变

华夏时报 浏览 609

同赛季获得欧冠和世界杯冠军最佳阵容:拜仁7人,小蜘蛛在列

直播吧 浏览 16129

巴西发起最致命反毒行动:致121人死亡 头号头目逃脱

红星新闻 浏览 7041

系“两条腰带”,历久弥新的时髦法则

时装男士杂志 浏览 19525

限量 100 台 电动 MINI JCW 蒙特卡洛 60 周年版上市

网易汽车 浏览 709

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 6733

虞书欣近况曝光!充钱偷看事业占卜被发现,火速摘灯牌隐身

萌神木木 浏览 883

李嘉欣姐姐身价猛涨,61岁姐妹合影展现瑰丽容颜

素素娱乐 浏览 16608

微软秘密武器亮相,英伟达CUDA护城河遭遇直接冲击

IT之家 浏览 486

怒批9人摆烂!穆帅不惧球员造反:你爸一直对你好? 4轮0分非末日

风过乡 浏览 229

一图看懂|朝鲜庆祝空军成立80周年 展示了哪些新式武器

澎湃新闻 浏览 12

“长安系”再落关键子:王辉亲掌阿维塔董事长

网易汽车 浏览 1524

台积电被特朗普「盯上」了

36氪财经 浏览 748

尹红星中将履新 已任西藏自治区“戎装”常委

上观新闻 浏览 20464

47岁舒淇的两场红毯表现 让所有人刮目相看

陈述影视 浏览 16631

他一夜干出2个英特尔,风头盖过马斯克

华商韬略 浏览 16271

德国军方举行演习被当地警方误判为“威胁” 遭警方实弹还击

环球网资讯 浏览 685

马拉戈:意大利惨败瑞士像开玩笑 斯帕莱蒂感觉被场上球员背叛了

直播吧 浏览 10904

静默复古风,低调显贵的穿搭密码!得物2025秋冬趋势发布!

LinkFashion 浏览 1664

人类50年消灭世界三分之二动植物,我们已经走上了命运的十字路口

趣看热点 浏览 25504

牛弹琴:特朗普迎最高兴一天 还求以方赦免内塔尼亚胡

映象网 浏览 4796
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1