关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11734人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

南岳衡山大量游客夜间滞留数小时 景区回应

上游新闻 浏览 76239

比亚迪4S店:宋L DM-i八月上市!没想到价格这么低

爱卡汽车 浏览 10687

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 420

标杆的智能化进阶 试驾一汽-大众全新速腾L

车质网 浏览 1317

前京东零售CEO辛利军卸任达达董事长 CFO陈兆明辞职

雷递 浏览 13109

55岁蔡国庆又被嫌弃,频繁被排挤的他,暴露中老年人的尴尬

不八卦会死星人 浏览 13196

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻 浏览 1340

官方:2024、25年两届欧会杯决赛将分别在希腊和波兰举办

直播吧 浏览 15908

宗馥莉第二次请辞 娃哈哈员工:宗庆后可能也没想到

澎湃新闻 浏览 4155

像虞书欣和欧阳娜娜这样穿真是“泰裤辣”

瑞丽网 浏览 19239

姚期智:我们建成了世界上最好的量子实验室之一

上观新闻 浏览 2036

东部第一!活塞双杀步行者13连胜平队史纪录 坎宁安24+11+6

醉卧浮生 浏览 830

谭咏麟与陈百祥现身瑞士,72岁高龄挑战高山滑雪

扒虾侃娱 浏览 20025

《王牌对王牌》最后一期为什么不请跑男家族?

趣看热点 浏览 26557

林永健批顶流进组带编剧乱改戏,网友总结合作演员,成毅被质疑

萌神木木 浏览 1389

谁都别想捂住李想的嘴:嘴炮,是福是祸?

市界 浏览 18421

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 758

今年秋天最流行的6条半裙,怎么搭都好看!

LinkFashion 浏览 2239

牛弹琴:沙特和伊朗在北京和解后 最大的后续来了

上观新闻 浏览 109109

伊朗警告美英停止袭击也门胡塞武装

环球网资讯 浏览 13066

白鹿baby不和风波升级!恩怨越扒越多于正也下场

叶公子 浏览 16945
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1