关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10322人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

重磅寄语!十大基金公司掌门人发声

中国基金报 浏览 19086

记者坐专列到淄博吃烧烤:单店日均售1万串 4点就排队

第一财经资讯 浏览 109707

梅西直播首秀现场曝光!迷弟苏醒赶去现场拍合照

萌神木木 浏览 15006

意媒:热刺只接受分期付款,不外租也不低于3000万欧出售霍伊别尔

直播吧 浏览 12251

NBA球员有哪些不为人知的副业?

趣看热点 浏览 24836

贾静雯晒一家四口出游照 波妞身高优越直追咘咘

侦探娱乐 浏览 13953

马拉多纳医生被调查,或存在过失杀人可能性

趣看热点 浏览 24631

甘肃男子亲历地震:当时零下15度 很多人熬不住回家了

红星新闻 浏览 73504

淝水之战为何会发生?淝水之战的交战双方是谁?

趣看热点 浏览 24359

奥特曼重新加入 OpenAI董事会;比特币突破7万美元大关;苹果中文官网出现Vision Pro|极客早知道

极客公园 浏览 11502

李玟的死亡引起甄妮质疑,提到现场致死的指甲刀

素素娱乐 浏览 12864

4000万的印度寡妇,只能算半个人

她刊 浏览 11493

韩国将向美提供50万发炮弹!韩媒:非常罕见

每日经济新闻 浏览 17985

掘金无缘登顶西部:约基奇9中8砍27+11+6里程悲 超越詹皇改写历史

厝边人侃体育 浏览 11860

大摩看空宁德时代遭怼 多位电新首席分析师隔空叫板

财联社 浏览 15674

初春时节,和关晓彤章若楠一起“绿”一下

瑞丽网 浏览 17965

官方通报贵州习水食物中毒事件:学生89人住院

界面新闻 浏览 15530

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 293

比亚迪唐DM-i保值率直逼汉兰达,只是巧合吗?

Nice好车 浏览 11791

售价47.8-66.8万元 2025款捷豹F-PACE正式上市

网易汽车 浏览 9493

一美国公民在俄罗斯被拘留 美方:已收到俄方通知

财联社 浏览 11199
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1