关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11639人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

履历造假?胥明军本人这么解释!交易所出手,奥联电子再收关注函

证券时报e公司 浏览 19536

德外长访华或调整"中国战略" 曾将台湾乌克兰并提

环球网资讯 浏览 19545

29国重兵云集,菲律宾打算不留后路?

浏览 10826

集结了三大天王出演的《超级学校霸王》,你不知道的幕后冷知识

趣看热点 浏览 26709

随着广东+上海+广厦全赢球,CBA最新积分榜如下:2队全胜+2队全败

侃球熊弟 浏览 243

美日韩签联合声明 用"最强硬措辞"谈及南海问题

环球网资讯 浏览 14458

乔治·索罗斯将开放社会基金会领导权交给其子

界面新闻 浏览 16404

刚播两集就火出圈,这剧杀疯了

独立鱼 浏览 15993

乌克兰决定与尼加拉瓜断交

参考消息 浏览 1058

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 1251

石破天惊,日本电影新浪潮的开山大师名作!

幕味儿 浏览 1088

印度吸血失败!俄罗斯不要卢比只要人民币

云掌财经 浏览 18307

飞机事故连连 波音再遇重创

北京商报 浏览 11652

程强:缩量反弹,关注宏观事件密集落地

首席经济学家论坛 浏览 1148

曼联梦想签奥斯梅恩,与拉什福德组新黑双煞!锋霸欧冠造点又破门

罗米的曼联博客 浏览 19506

NBA战报:尼克斯134-98狂胜篮网取NBA4连胜,唐斯28+12+2

懂球帝 浏览 902

摩登兄弟刘宇宁道歉是怎么回事?极限挑战宝藏行综艺节目中摘雪莲道歉

趣看热点 浏览 26552

“Mag 7”过时了?华尔街想要AI!

华尔街见闻官方 浏览 1692

一眼心动的夏日约会穿搭!温柔气质不挑人!

她暖 浏览 16417

特斯拉回应Cybertruck皮卡生锈问题!

时代汽车网 浏览 12733

特朗普涉俄乌冲突再次表态:有时候必须让他们打到底

鲁中晨报 浏览 5986
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1