关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11804人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日娱圈惹争议!男偶像被要求肢体骚扰未成年女粉,粉丝欲卖身追星

文艺圈娱乐号 浏览 13505

2026第一部「神」剧,诞生了

独立鱼 浏览 186

比利亚雷亚尔vs阿拉维斯:阿约塞-佩雷斯、帕雷霍首发,阿莱尼亚、洪尼-奥托出战

懂球帝 浏览 87

泫雅龙俊亨官宣恋情!两人8年前就常深夜喝酒

缘木不求娱 浏览 13010

豪华大六座SUV/最新鸿蒙座舱 岚图泰山将于11月18日上市

网易汽车 浏览 1075

岸田文雄表态:将继续密切关注俄罗斯局势发展

环球网 浏览 14589

电商链的诺基亚时刻

斑马消费 浏览 15190

美欲推动加沙停火计划第二阶段 专家:既想占好处又不愿担责

环球网资讯 浏览 1346

上新 || 降温了!几套实用保暖穿搭请收好

黎贝卡的异想世界 浏览 1243

细节优化,2025款大众高尔夫GTI实车图像曝光

天天汽车 浏览 12938

新款奥迪Q7到店,换装“新脸”还带“黑武士”装扮,外观更帅气

闻车品百魅 浏览 11153

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

伊周潮流 浏览 569

汽车“换道超车”,伪命题or真理?

汽车公社 浏览 1002

登贝莱:踢什么位置教练说了算,我很喜欢中锋位置

懂球帝 浏览 1911

丘库埃梅卡:欧冠进球对我而言是巨大动力;本赛季想拿个冠军

懂球帝 浏览 1122

金价算是彻底失控!不是因为涨到1000多,那些回收店排起了长队…

火山诗话 浏览 1366

吉利销售:8座MPV月底上市!或卖40万,比理想Mega漂亮多了

网上车市 浏览 12875

"点读机女孩"高君雨紧急转进ICU 家长:持续发烧不退

红星新闻 浏览 69952

圣诞节,我想看这几部电影!

Yuki女人故事 浏览 538

斯基拉:国米仍想明夏免签塔雷米,计划向他提供3年合同

懂球帝 浏览 13800

张子萱近照曝光脸胖一圈 穿露脐装破怀三胎传闻

叶公子 浏览 13752
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1