关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10332人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

重塑豪华标杆 全新长轴距奔驰E级河南上市

小号撩车 浏览 11576

五门版悦也官图发布,命名“宝骏悦也PLUS”

天天汽车 浏览 11299

中南双能卫渴望逐梦CBA:希望能冲击下 想去宏远

网易体育 浏览 16209

媒体:上合组织因俄乌战事面临三重困境 中国迎来机遇

直新闻 浏览 62366

孙俪参加大提琴英皇初级考试 开心晒成绩单获高分

娱絮 浏览 17739

人到中年穿搭不必浮夸 注意这三个优雅细节

Yuki时尚酱 浏览 11664

国产汽水50年:健力宝"王者沉沦" 老汽水品牌纷纷复出

鬼谷子思维 浏览 111366

郑欣宜因抑郁症停工4个月后暴瘦 久违现身露笑颜

云图娱乐 浏览 13939

台防务部门又紧张:今早5时起,37架次解放军军机进入台西南空域

环球网资讯 浏览 15563

程又青,30岁的你也会生长痛吗?

时尚COSMO 浏览 11

邮报:欧文儿子因眼部疾病,放弃成为足球运动员

直播吧 浏览 11580

拼多多第四季度营收398亿,同比增长46%

网易科技报道 浏览 17711

俄国防部称缴获2辆德制"豹2A6" 媒体:普京笑了

直新闻 浏览 15391

离职员工与“老东家”走上法庭 “百万粉丝大号”归谁?

每日经济新闻 浏览 15071

美媒:狄龙今日将与湖人、雄鹿、独行侠和火箭进行会面

直播吧 浏览 14415

定位旗舰车型 别克GL8电动版或2024年上市

车质网 浏览 11163

小S二女儿穿粉色衣服向芭比致敬 妩媚眨眼引热议

每日新鲜事吖 浏览 13424

妓女身份被揭穿,喝药自杀,褚韶华却助力康二妞实现蜕变新生!

电和影 浏览 296

天马推出高端 OLED 技术品牌“天马天工屏”

IT之家 浏览 351

太离谱!董路:对手喊来说是10年龄段的球员,结果赛后自己开车走

直播吧 浏览 14426

Ella自曝曾遭遇性骚扰:我是爬着出来、哭着出来的

网易娱乐 浏览 14969
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1