关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11794人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50多岁女人不要“装嫩”,掌握这些搭配原则,衣品提升一大截

静儿时尚达人 浏览 1153

比亚迪挥刀降价后 第9周车市销量如何?大众喊出“油比电强”参战

蜗牛车志V 浏览 12740

正式公示!一批新大学来了!

中国基金报 浏览 12971

男子租豪车装富豪诈骗40多名女性 出身农村仅读过小学

红星新闻 浏览 80446

郝蕾暗讽辛芷蕾,内娱回到十年前了?

大龄女一晓彤 浏览 1051

给过去10年最好的谍战剧排个名:《沉默的荣耀》第6,《风筝》第2

皮皮电影 浏览 1004

15岁费曼晒初中毕业照,头发又长又卷遮住双眼,长相和儿时区别大

娱絮 浏览 11336

“工业机器人曾是日本的堡垒,但中国已开始在新轨道上竞争”

观察者网 浏览 607

被拐25年的解清帅大婚 婚礼现场有主播直播带货

半岛官网 浏览 1387

德外长访华或调整"中国战略" 曾将台湾乌克兰并提

环球网资讯 浏览 19698

媒体:李尚福成为中国防长后第二次访俄 信息量不小

直新闻 浏览 15001

女孩在高铁遭掌掴后还击被认定为"互殴" 司法部发声

都市快报橙柿互动 浏览 117104

明星工作室接连注销,娱乐圈又有大瓜要来了吗?

趣看热点 浏览 26929

李嘉欣的百万阔太装,好像某宝地摊货

InsDaily 浏览 16829

盘点中国金花法网战绩,张帅英雄迟暮,袁悦折戟资格赛(上)

网球之家 浏览 17024

荣耀Magic5系列国行发布3999元起:"青海湖"电池+鹰眼相机

网易手机 浏览 19522

靠创新药结束连续8年亏损局面,百济神州烧百亿研发终迎转机

览富财经网 浏览 1877

天汽模五年四谋易主 陷增长瓶颈中期扣非降90%

长江商报 浏览 1910

这次没醉酒了吧?王岳伦再曝与美女搂腰亲密照,李湘晒狗疑暗讽

趣看热点 浏览 26785

为“打击贩毒” 美军调派“福特”号航母至加勒比海

央视新闻客户端 浏览 980

周末利好刷屏!中美元首通话、国常会重磅,下周一重磅发布会

看财经show 浏览 2095
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1