关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11915人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新美联储通讯社:美联储暗示暂停降息行动,新债王:今天或是鲍威尔任内最后一次

华尔街见闻官方 浏览 808

蔚来乐道汽车迎 11 万台新车交付,距离 10 万台里程碑仅 13 天

IT之家 浏览 1285

一张图理清:美国抓捕委内瑞拉总统马杜罗始末

看看新闻Knews 浏览 402

央视一姐董卿“陨落”!51岁的她成于自己

君笙的拂兮 浏览 2127

演员黄璐将惊喜现身明日艺术影院映后❤️

幕味儿 浏览 1106

张柏芝自曝被大儿子管很凶,教子有方连谢霆锋妈妈都称赞

扒虾侃娱 浏览 1357

五粮液能“平替”茅台?

虎嗅APP 浏览 17627

4战狂胜266分!韩旭14+8四川全运女篮大胜辽宁 头名进八强

醉卧浮生 浏览 1199

比亚迪重金奖励举报腐败行为,最高500万元!

红星新闻 浏览 14829

一天开店12家!手握上市时间表盒马要争第一?

华夏时报 浏览 16092

以前看不上,现在恨不得演两集!

伊周潮流 浏览 13344

年销再破百万 | 进取的上汽大众,蜕变的2025

网易汽车 浏览 284

整个A股,只有这15个股票有垄断特征,市盈率低至12倍!

资本百科 浏览 17368

开启新赛季,迈阿密国际全队启程前往萨尔瓦多参加首场热身赛

懂球帝 浏览 13051

豫媒:河南队泰国拉练只花了15万元,在当地踢热身赛一胜一平

懂球帝 浏览 844

俄媒:美国社会撕裂程度接近美国内战时期

环球网资讯 浏览 13402

华为nova 15 Ultra / Pro支持自研Wi-Fi 7+芯片级协同技术

IT之家 浏览 593

Transformer开山论文惊天"翻车"?图与代码不一致,神秘bug看傻了

新智元 浏览 19013

香港歌手因在春晚唱了一首歌被封杀14年 如今身价过亿

大佬日志 浏览 78949

高效训练新标杆!华人开源原生VLM-NEO,以少数据追平顶级模型

DeepTech深科技 浏览 1380

冲着陈晓去看《大生意人》,却被满脸狰狞的两位东北跨界演员惊艳

娱乐圈笔娱君 浏览 843
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1