关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11912人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

赵继伟伤退,广东击败辽宁,与浙江会师男篮决赛!

体坛周报 浏览 1222

马绩效:尤文对皇马机会多但把握差,很难说这就是积极的表现

懂球帝 浏览 1374

日本主妇真会穿!衬衫T恤也能穿得洋气

八分搭配 浏览 16994

国产丰田普拉多计划将于2月开启小定!或将定价35万左右,很亲民

小史谈车 浏览 13094

股价太低迷!许世辉57亿港元回购,达利食品私有化破局

蓝鲸财经 浏览 16514

V我50,集资穿越向秦始皇献策科目三

时尚COSMO 浏览 14122

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 1556

有气质的中年女人不瞎穿,试试这三种受欢迎的冬季单品,时尚大气

Yuki时尚酱 浏览 13985

你有没有发现 保时捷越来越像大众了?

网易汽车 浏览 1331

47岁舒淇的两场红毯表现 让所有人刮目相看

陈述影视 浏览 17408

2024年第一颗大雷爆了?富人收割机,终于割不动了

象视汽车 浏览 13222

世界经济论坛报告:AI驱动的错误信息是全球最大的短期威胁

财联社 浏览 13006

氢能汽车的十字路口:巨头的撤退与坚守

车质网 浏览 1052

2026年商品消费扩容升级 电商平台在行动

北京商报 浏览 266

马杜罗在纽约首次“出庭” 多国发表联合声明

环球网资讯 浏览 383

70后女性最有效的减龄打扮,不显老不花哨,老了也是一枝花

静儿时尚达人 浏览 11884

特朗普取消"特普会"对俄追加制裁 俄发出强烈威慑信号

上游新闻 浏览 5779

397场,凯尔-沃克追平英超历史边后卫首发次数纪录

懂球帝 浏览 1386

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 1149

这是想扎心❓C罗ins最新动态评论区被梅西拿金球&世界杯动图刷屏

直播吧 浏览 13735

马拉多纳生前最后语音曝光遗言内容令人唏嘘

趣看热点 浏览 26710
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1