关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11863人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“90后”业务员骗走上海一独居老太980万挥霍一空,大部分用于直播打赏

上观新闻 浏览 15281

还是这些穿搭适合秋天!衣服多穿一下“基础款”,百搭又舒适

静儿时尚达人 浏览 1508

男子放弃登顶珠峰救人被质疑:已用无人机拍下证据

每日经济新闻 浏览 90294

2024年了,最好看还是这件大衣!

LinkFashion 浏览 13875

大带宽+低时延!F5G如何撑起城域“毫秒用算”?

览富财经网 浏览 1371

英伟达H100杀疯了:11分钟训完GPT-3,霸榜8项测试

量子位 浏览 16172

茅台卖咖啡,28 元起一杯,含1.8ML茅台酒

红星资本局 浏览 16693

他一夜干出2个英特尔,风头盖过马斯克

华商韬略 浏览 16820

男子被钻机拧断胳膊未获赔 法院查封800吨煤被矿方私售

大风新闻 浏览 6553

迪亚斯:会像球迷一样享受皇马vs曼城 现在100%专注于AC米兰

直播吧 浏览 19228

AI眼镜,大厂第一战

脑极体 浏览 843

预计2026年正式发布 全新现代i20渲染图曝光

车质网 浏览 1358

张丹峰洪欣离婚后续:儿子改母姓 洪欣露面状态好

叶公子 浏览 19166

西蒙尼获第60场欧冠胜利,与克洛普并列主教练胜场榜单第7

懂球帝 浏览 1236

美国前主播:美国出卖了乌克兰 50年后这国家就没了

观察者网 浏览 68785

俄称已控制红军城和沃尔昌斯克

国际在线 浏览 864

美英对也门胡塞武装军事目标发动新一轮袭击

央视新闻客户端 浏览 13153

“双引擎”再提速:中国资本市场改革释放创新红利

财经众议院 浏览 1146

加沙停火草案被美国一票否决 中国大使发出"灵魂三问"

每日经济新闻 浏览 12579

北京算力巨头,掏150亿收购

21世纪商业评论 浏览 11298

仗着野猫脸无代餐就飘了?

新氧 浏览 16335
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1