关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11885人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

60+女人,秋天穿衣“上紧下宽”,不紧绷、不暴露,优雅年轻

静儿时尚达人 浏览 1491

张若昀首谈女儿满脸宠溺,现场示范换尿布动作娴熟

趣看热点 浏览 26795

人社部就业促进司:我国人口红利没有消失

新华社 浏览 16637

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 873

普里戈任发表讲话:撤退是为避免俄罗斯人流血

界面新闻 浏览 19361

退休三年后“落马”,恒邦财险原董事长肖晓华被查

蓝鲸Insurance 浏览 0

外媒评GPT商店:OpenAI向平台演变一大步

网易科技报道 浏览 13288

历时8小时,神舟二十一号乘组第一次出舱任务全回顾视频发布

IT之家 浏览 802

全是感动!《许我耀眼》33集大结局,是我今年看过最泪奔的大结局

娱乐圈笔娱君 浏览 1548

俄国防部:一架L-39教练机于俄南部机场内坠毁

环球网资讯 浏览 14598

消息称台积电正与2nm制程潜在客户商谈,单片晶圆报价2.5万美元

爱集微 浏览 15827

向太儿子向佑近照流出 威胁父母“不给钱我就去借”

鲁中晨报 浏览 5003

王世龙:对方小外援费尔德今天没出战 我们打得比较松

直播吧 浏览 20016

邱泽妈妈没想到 这个女人竟把她儿子狠狠“拿捏”

黄小仙的搞笑视频 浏览 819

林雪演戏被喂烂提子,被林雪笑死了被问到有没有想过减肥

趣看热点 浏览 28548

事关特朗普大选资格 美国最高法院发声

每日经济新闻 浏览 74704

本田东京车展亮相0系列电动概念车 揭示未来出行

网易汽车 浏览 1236

华为智选车模式胜出?背后赢家浮现

格隆汇 浏览 19826

大咖对话:从L2到L4,如何破解高阶智驾落地难题

网易汽车 浏览 766

马卡:比利亚雷亚尔将免签21岁阿根廷边锋蒂亚戈-费尔南德斯

懂球帝 浏览 703

跨年晚会主持人状态曝光!靳梦佳被质疑整容

萌神木木 浏览 407
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1