关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11968人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

图片报:巴黎有意科隆19岁边锋赛义德-马拉,已与球员方面接触

懂球帝 浏览 1487

欧洲联军派几十个人的小分队到格陵兰 媒体:大有作用

看看新闻Knews 浏览 11713

朝鲜举行宴会欢迎中国大使到任 朝方女外相出席致辞

环球网资讯 浏览 112677

张雨剑吴倩带女儿出游,看起来一家人真幸福

趣看热点 浏览 26699

茅台股东大会又一年:但斌缺席 有小股东投反对票

时代财经 浏览 16685

奈飞联合创始人向慈善机构捐赠所持四成股权,价值超11亿美元

澎湃新闻 浏览 12993

爱马仕继承人,千亿家产被最好的朋友骗光

Yuki女人故事 浏览 911

配置升级 2026款雷克萨斯LS官图正式发布

车质网 浏览 1819

29分钟打卡29+13!坎宁安完压布伦森被赞MVP 尼克斯陷4连败泥沼

颜小白的篮球梦 浏览 440

美媒:特朗普已听取关于军事打击伊朗方案的汇报

新华社 浏览 320

马筱梅吐槽老公,称嫁到大陆鲜花都是粉丝送的,汪小菲只送过一次

扒虾侃娱 浏览 1992

全国政协委员、恒银科技董事长江浩然:新质生产力的内核离不开“科技创新”

经济观察报 浏览 12732

边打字边出片,交互式生成长视频!英伟达联合MIT开源新SOTA

新智元 浏览 1586

智界S7交付困难,另有隐情?不是产能不足,而是有人“使绊子”?

小李车评李建红 浏览 13093

被广州街拍女生惊艳了!衣装宽松、鞋穿平底,看似简约却随性高级

潮人志Fashion 浏览 14244

强势搜证提告娱记!大S疑化解危机 葛斯齐改口辩解

娱乐团长 浏览 16077

乌军丢失"钢铁要塞" 俄军争夺战被形容为"非常血腥"

枢密院十号 浏览 83170

港媒曝谢霆锋长子疑似情窦初开,携异性澳洲逛街

扒虾侃娱 浏览 15166

女儿严重高反 男子订回程票出错立即取消重订被扣两千

上观新闻 浏览 9989

贾静雯晒一家四口出游照 波妞身高优越直追咘咘

侦探娱乐 浏览 15464

媒体:美一系列肆行无忌行径 释放极其危险信号

上观新闻 浏览 4871
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1