关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11788人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

足球报:国安并非没考虑过土帅,针对今年问题已做长远规划

懂球帝 浏览 1419

贾静雯晒一家四口出游照 波妞身高优越直追咘咘

侦探娱乐 浏览 15318

通用汽车宣布苹果前高管加盟,将担任软件业务执行副总裁

界面新闻 浏览 18482

高质量孵化器里有了“机器人驾校”

文汇报 浏览 1009

东部战区发布联合演训区公告及示意图

新华社客户端 浏览 354

德媒:德总理拟动用俄央行在德冻结资产援乌

新华社 浏览 538

【IT之家开箱】口袋中的完全体哈苏:OPPO 哈苏专业影像套装图赏

IT之家 浏览 1420

教父退位,二代登场!恒隆集团2023年还好吗?

杠杆游戏 浏览 13123

英王子因萝莉岛被死人"指控" 前妻与爱泼斯坦猛料被扒

新民晚报 浏览 7151

惨!周星驰电影5天票房仅86万,时代抛弃你时,连句再见都不会说

娱乐圈笔娱君 浏览 666

掉队!第一省会,急了!

城市财经 浏览 11621

一名德国男子因涉嫌为俄罗斯从事间谍活动被捕

环球网资讯 浏览 15086

98版沙僧刘大刚去世,最后露面曝光

科学发掘 浏览 1024

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 1333

24年历史数据揭秘:龙年首个交易日,A股能否“龙抬头”?

第一财经资讯 浏览 13133

以军打死数十名哈马斯指挥官 特朗普:应该的

每日经济新闻 浏览 1182

想把宽松T恤焊在身上 经典又好穿

男士穿衣搭配杂志 浏览 15705

济南新增1例境外输入病例,21日曾乘坐G882次高铁

趣看热点 浏览 140813

欧盟打脸撤回“燃禁令”9个月 各方表现堪比大片上演

第五冲程 浏览 12609

萨顿:如果奥斯梅恩真有野心,他会优先考虑枪手而非蓝军

直播吧 浏览 12900

十五运会开幕式收视出炉!最高破3.9%,刘德华上场涨出小高峰

萌神木木 浏览 993
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1