关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11922人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄安全局称击毙四名企图渗透到俄境内乌破坏人员

环球网资讯 浏览 14866

人工智能时代,应警惕“思维钝化”

环球时报国际 浏览 12832

33岁的张一山惊艳亮相,杨紫这次真得避嫌了?

探长影视解说 浏览 1209

内塔尼亚胡遭遇“全球孤立” 联大发言多国代表离席

环球网资讯 浏览 2135

周润发现身街头买盒饭 认真挑选毫无巨星包袱!

娱乐团长 浏览 13469

最新!59岁胡望明任中国宝武钢铁集团董事长

每日经济新闻 浏览 16776

荣耀 MagicPad3 Pro 13.3 英寸平板上架官网

IT之家 浏览 1978

爷爷爱穿的生胶鞋,现在又成为时尚单品了?!

伊周潮流 浏览 15646

香港闹市发现二战时期美军投射炸弹 耗时12个小时拆除

新民周刊 浏览 23384

晋武帝司马炎的“太康之治”是怎么一回事?西晋开国皇帝对政治上的改造

趣看热点 浏览 26434

从胶体物理到创新药,南科大团队提出大分子药物稳定新理论

DeepTech深科技 浏览 133

诺伊尔说希望自己看上去没有马特乌斯那么老,随后赶紧纠正

懂球帝 浏览 2221

新增120城 蔚来城区NOP+覆盖中国大陆99%城市

网易汽车 浏览 12537

重庆女子乘"黄色法拉利"去内蒙古:计价器爆表了

大风新闻 浏览 16428

未婚未育男子将遗产留给外甥遗嘱却写错名字 法院判了

环球网 浏览 7013

2024将上市10款重磅油车,越看越想买!方盒子硬派SUV你选谁家?

蜗牛车志V 浏览 13373

乌记者询问中方是否计划向乌克兰提供援助 外交部回应

上观新闻 浏览 92566

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 1303

全国人大代表、东方财富董事长其实:加大对于早期科创的支持力度

时代周报 浏览 13047

风电龙头明阳智能拟跨界太空光伏

北京商报 浏览 181

男明星与女明星回应绯闻对比,主打一个反差

传媒一班 浏览 15918
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1