关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11947人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

17个街道年投入逾亿元 资质错配、服务动力不足何解?

南方都市报 浏览 742

一位基金经理的真情告白

金石杂谈 浏览 13102

Sora刷屏!哪些A股上市公司或将受益?

投资者网 浏览 13008

特斯拉Q3销量首超梅赛德斯奔驰,一个时代终结了?

江瀚视野 浏览 1521

拉亚离队前先续约?小蜜蜂总监解释:更快完成转会,同时给我们留余地

直播吧 浏览 14965

俄国防部:一架L-39教练机于俄南部机场内坠毁

环球网资讯 浏览 14634

网易2023 Q2财报:净收入240亿元,AI技术助自研游戏爆款频出

网易科技报道 浏览 14887

媒体:黎智英受审获西方关注 曾公开宣称"为美国而战"

直新闻 浏览 75582

西蒙尼:巴埃纳在不同位置都能帮我们;我们有很大提升空间

懂球帝 浏览 1202

守不住,阿森纳连续20次联赛对利物浦每场都失球

懂球帝 浏览 354

科技氛围浓郁 全新奥迪Q5L内饰正式公布

车质网 浏览 940

最强动物塑,全在ZOOTOPIA里了

时尚COSMO 浏览 779

日本平台征集"批评中国"视频每条180元 日本网民炸锅

极目新闻 浏览 11702

主动援藏的博士升副部5年后落马:受贿18年 搞钱色交易

南方都市报 浏览 74948

土耳其对内塔尼亚胡等人发出逮捕令 以色列回应

环球网资讯 浏览 1193

若乌方试图袭击克宫俄方将作何反应 佩斯科夫表态

环球网资讯 浏览 2041

修杰楷庆祝生日获贾静雯献吻 称继女是"宝贝女儿"

娱絮 浏览 19912

可能被“没收”一半股权,谷歌创始人逃离硅谷

字母榜 浏览 314

国资入主黑芝麻再进一步:国资委审批落地,约定承诺期净利润累计不低于3.15亿元

红星资本局 浏览 711

快过年了才发现:羽绒服不兴了!满街都是“大衣裹围巾”,特洋气

潮人志Fashion 浏览 14021

47岁舒淇的两场红毯表现 让所有人刮目相看

陈述影视 浏览 17440
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1