关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11746人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

4天3赛干了129分钟!阿努诺比:不知道我顶不顶得住……

直播吧 浏览 12814

累瘫?三战全打满40分钟 从40+9到11+5失误 黑龙江女战神也顶不住

颜小白的篮球梦 浏览 1348

知情人曝李昀锐孟子义真谈了!狗仔疑似发文内涵,太多细节藏不住

萌神木木 浏览 1478

杭州启用AI交通管理机器人“杭行1号”;印尼洪灾和山体滑坡已致超600人遇难

上观新闻 浏览 676

今年最狠悬疑剧,好人为何集体沉沦?

仙女事件簿 浏览 1262

摩尔线程:股票价格可能存在短期上涨过快出现的下跌风险

网易财经 浏览 623

网曝王心凌出场费超三百万!百亿帅气总裁变迷弟

盖饭娱乐官方号 浏览 19496

独家|我们与淘宝闪购管理层聊了聊增长的持续性问题

虎嗅APP 浏览 1266

李沁,一款全方位健康的“老式小孩”

时尚COSMO 浏览 2261

国羽包揽韩国公开赛混双冠亚军

体坛周报 浏览 1833

一文看懂副业真相,斜杠青年赚钱吗?

钛媒体APP 浏览 16521

法大大黄翔:从他山之石看中国企业数智化升级的机会点

数据猿DataYuan 浏览 11214

AI终端战事升级:大厂跨界厮杀,阿里、字节、理想同场竞速

时代财经 浏览 562

秋天别错过卫衣搭长靴 少女感兼具少年感

巧百搭 浏览 15571

这些真是中年女性的穿衣典范,看这些穿搭就对了,优雅不扮嫩

静儿时尚达人 浏览 11641

发力高质量发展!全国人大代表李政:深耕高端制造,掌握更多核心科技

时代周报 浏览 19333

陶哲轩新论文:部分证明著名素数猜想,新方法用到了自己的旧模型

量子位 浏览 15302

犯罪团伙大胆却“业余”,珠宝黑市隐蔽且暴利,FBI前探员拆解卢浮宫劫案

环球网资讯 浏览 1304

永辉生活APP卖茅台只收款不发货,超市也要加入炒白酒大军了?

趣看热点 浏览 598143

杨紫琼周润发等众星聚会!业内大咖均在场

盖饭娱乐官方号 浏览 16577

司马懿伐辽东留残局隋唐两朝困扰50年!唐太宗也头疼

趣看热点 浏览 26773
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1