关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11903人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

原来他们是夫妻,恩爱27年无绯闻.现是影协主席

冷紫葉 浏览 1965

孙燕姿被曝要与曲婉婷合作,二人过往互动被扒,关系亲密是好朋友

萌神木木 浏览 610

热巴亮相活动大秀美背 太惊艳了

萌神木木 浏览 20413

TII发布Falcon-H1R:7B小模型推理能力超越32B大模型

科技行者 浏览 270

刘荷娜晒林志颖合照 笑容灿烂梦回《放羊的星星》

网易娱乐 浏览 20469

最高续航达610km 江铃羿驰05S上市售9.79万元

网易汽车 浏览 1389

时隔8年,苏农银行终换行长

财经众议院 浏览 1226

预计4月初发布/价格落到30万内 理想L6实车亮相

网易汽车 浏览 13024

一加 15 手机现身中国电信终端产品库,10 月 27 日发布

IT之家 浏览 1335

生前屡出奇谋、被刘备重视的猛将死后头颅被杨仪当球踢

趣看热点 浏览 26987

进一步加长 搭载2.0T动力 新一代奥迪A6L实车曝光

网易汽车 浏览 1547

意甲-C罗破门+中柱!贝司机两助攻 尤文3-0大胜

网易体育 浏览 26472

热搜前十,竟全是「人造娇妻」

她刊 浏览 14219

硅谷的「十万大裁员」:Meta按代码量裁员

新智元 浏览 1359

“比特币富婆”钱志敏在英国认罪,6.1万枚比特币市价已达493亿元,赃款归谁?

红星新闻 浏览 1254

微软阿里遥遥领先!中美云巨头狂投1600亿,争做大模型最强金主

智东西 浏览 12226

E句话| 邢菲为违反交通规则道歉了?

仙女事件簿 浏览 930

发布多模态交互开发套件,发力硬件抢占入口!阿里云已兵分两条路布局AI手机

时代财经 浏览 278

爆火的“表演饭”,开始被年轻人避雷

餐饮老板内参 浏览 1423

杨幂抿嘴习惯恐难改善,被指医美后遗症,演员真的别轻易动脸!

萌神木木 浏览 11631

袁悦苦战182分钟惨胜后遭调侃打球兼项马拉松,吴易昺疑似又伤了

网球之家 浏览 204
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1