关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11894人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

朴敏英被质疑收前任上亿生活费,本尊否认

文艺圈娱乐号 浏览 13335

港姐离婚案!前夫现身法庭自爆曾遭家暴

TVB剧评社 浏览 16101

24座“万亿之城”一季报:12城GDP增速超全国

澎湃新闻 浏览 18829

坚持10年做这件小事,我收获了太多

黎贝卡的异想世界 浏览 1390

歌手出场费揭秘!薛之谦价格媲美林俊杰,杨丞琳比张韶涵低50万

萌神木木 浏览 474

全明星东部吊打西部!约基奇尬笑,球迷嘘利拉德,哈利伯顿沮丧

篮球资讯达人 浏览 12790

睡醒了继续庆祝!哈兰德晒高举欧冠奖杯照,并附夺冠日期纪念

直播吧 浏览 16994

vivo S50系列手机侧边外观图公布,全系航空铝金属中框

IT之家 浏览 976

人社部就业促进司:我国人口红利没有消失

新华社 浏览 16638

科学家发现地球最小爬行动物,最大体长仅29毫米

趣看热点 浏览 26438

50+女人怎么穿出时尚感?掌握这3招技巧,重新定义优雅与潮流

静儿时尚达人 浏览 1541

丰富个性化选择,吉利银河L7新增“星瀚绿”配色

天天汽车 浏览 12951

五十多岁的女性秋季别瞎打扮,这3个技巧实用还时髦,快收藏

静儿时尚达人 浏览 1227

一美国公民在俄罗斯被拘留 美方:已收到俄方通知

财联社 浏览 12745

泫雅的衣品真不错 穿紫色裙子时尚又减龄

双鱼爱畅谈 浏览 19912

上海97-77大胜浙江,李弘权18分,吴前15分,兰道夫27+5

懂球帝 浏览 604

京东健康公布2023中期业绩 半年收入271亿元同比增34%

网易科技报道 浏览 15156

沙特,一部活色生香的《一千零一夜》

时尚COSMO 浏览 1332

3万月薪急招董秘!安徽五粮液大商要港股IPO?95后海归接棒,一天卖酒30万瓶

时代周报 浏览 5

李念挺3胎孕肚参加香港阔太聚会 已怀孕8个月

云图娱乐 浏览 19620

长城汽车10月销售新车14.31万辆 同比增长22.5%

网易汽车 浏览 1267
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1