关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11757人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

来了!小鹏P7+增程版申报图现身

Nice好车 浏览 1422

泽连斯基暗示中国破坏和平峰会 外交部回应

环球网 浏览 67740

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 601

汽车“换道超车”,伪命题or真理?

汽车公社 浏览 973

高市成日本史上首位女首相 石破茂曾抱怨当首相太累

鲁中晨报 浏览 6431

宝马投资7亿美元改造慕尼黑工厂,2027年底开始专门生产纯电动车

网易科技报道 浏览 12795

李玟的死亡引起甄妮质疑,提到现场致死的指甲刀

素素娱乐 浏览 14275

俄军称再拿下哈尔科夫地区一村庄

每日经济新闻 浏览 11230

8000万年薪!沙特媒体:吉达联合正争分夺秒说服萨拉赫加盟

直播吧 浏览 14653

碳酸锂价格,巨震!

证券时报 浏览 827

大学副教授成老赖仍开宝马用新手机 一次餐费花8000元

新京报 浏览 5680

官员被双开 曾共事的原副市长与黑社会结成"干亲家"

上观新闻 浏览 95392

全国人大代表、华海药业总裁陈保华:建议制定全国层面的人才发展促进法

经济观察报 浏览 12511

上年纪的女人买“裤子”,不妨按照这3个原则试试,显瘦时髦

静儿时尚达人 浏览 1404

赵少康称"很多人想退党" 黄建豪:应给郑丽文时间调整

海峡导报社 浏览 6059

对话黑芝麻高管:不烧钱造新芯,机器人平台发布前已经创收

车东西 浏览 827

7万+再创造车新势力月销纪录 零跑或成下一个中国前十

道哥说车 浏览 1046

瑞银30亿瑞郎拿下瑞信 5万亿美元“巨无霸”诞生了

每日经济新闻 浏览 105351

向太声称女生不要下嫁,网友质疑何超莲窦骁离婚

草莓解说体育 浏览 1313

“龙茅”开售!抢到就赚5000元?

中新经纬 浏览 12911

俄称打击乌军多处目标 乌称击退俄进攻

国际在线 浏览 1112
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1