关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11851人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉夫罗夫:瓦格纳事件后 俄变得更强大

环球网 浏览 16042

哪吒汽车“重启”新进展

大象新闻 浏览 668

让男人上头的“伟哥”,遭遇大败退

花朵财经 浏览 1168

爆冷!莫布利29+8骑士崩盘输猛龙 巴特尔三分6中6引3人20+

醉卧浮生 浏览 1236

李湘为女铺路太过,带16岁王诗龄,硬往何超琼霍启刚等大佬圈层挤

不八卦会死星人 浏览 578

曾经最具知名度的播音员病逝 丈夫也是央视知名主持人

环球网 浏览 16203

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 2094

4年1亿也能接受!曝湖人愿匹配任何里夫斯报价:为何仍准备替代者

罗说NBA 浏览 16114

90年代妈妈们有多潮?穿一次妈妈的旧衣服就懂了

时尚搭配师Nicole 浏览 20530

负债数亿,足力健卖食品要开20000家店

中国企业家杂志 浏览 1119

1月10日开启预售,零跑C10新配色“琉璃翠”发布

天天汽车 浏览 13468

应李强总理邀请 俄罗斯总理时隔半年多再次来华

北京日报客户端-长安街知事 浏览 74729

荣耀MagicOS 10升级设备数突破1000万 力争春节前都能升

快科技 浏览 538

赵丽颖7月暂无行程,被曝与冯绍峰有望复合

深剖娱乐圈 浏览 16062

保安业务第一股,安邦护卫上市仅两月暴跌50%,无数投资者的噩梦

资本百科 浏览 12825

恩里克:0-0通常让人觉得比赛沉闷,但今天完全不是这样

懂球帝 浏览 751

杭州男子金价大涨前卖6千克金条变现289万 1周少赚14万

潇湘晨报 浏览 83837

四川又有一家四口误食"白罗伞"中毒住进ICU 家属求助

红星新闻 浏览 64654

杨幂采访揭掉古偶遮羞布,粗制滥造、撕番炒作,明星都不屑提及

萌神木木 浏览 12962

冲绳知事7月将第三次访华:冲绳绝不能再次沦为战场

环球网资讯 浏览 92705

小S复出获奖细节:纹了大S名字还带了骨灰

萌神木木 浏览 1473
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1