关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11944人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郑丽文"不谈统一"让人失望了 蔡正元的话一针见血

现代小青青慕慕 浏览 6379

泽连斯基称俄罗斯正为更大规模冲突做准备 俄方回应

红星新闻 浏览 2037

事实证明,中年女性穿的贵比扮嫩更重要,这么穿就很提升气质

静儿时尚达人 浏览 11643

或告别燃油时代 丰田Supra将于明年停产

车质网 浏览 1356

林俊杰疑似回应恋情:无需多言

粵語经典歌單 浏览 994

解放军演习期间蔡英文发图称都有掌握 国台办回应

环球网资讯 浏览 19340

一则关注函,曝出大消息!众泰汽车筹划变更实控人

创作者_1486537600008 浏览 16135

她们说这才是秋天最实用的单品!6种穿法都帮大家总结好了

黎贝卡的异想世界 浏览 1258

泽连斯基:乌美就领土问题讨论长达6.5小时

每日经济新闻 浏览 14161

近7成应届生求职最关注薪酬福利 46.7%首选国企

第一财经资讯 浏览 19034

萨拉赫还是萨卡?墨菲:萨拉赫,他总能进些不可思议的球

懂球帝 浏览 1098

从狂飙到猛踩刹车,动力电池行业洗牌加剧

第一财经资讯 浏览 19633

李铁案传递反腐新信号 教授:其或被判10年以上或无期

长安街知事 浏览 75261

2024年,你多少要了解下“公募REITs”

锦缎研究院 浏览 13476

来自日产的中大型SUV,日产探陆预售23.98万起

天天汽车 浏览 13011

盲打!快船和掘金比赛连续出现计时器故障,裁判被迫手动计时

懂球帝 浏览 1507

千亿巨头重大收购!华为火速回应

中国基金报 浏览 11447

入夏裤子就穿这4条 清凉显廋巨时髦!

In风尚 浏览 17642

近半年“主观VS量化”!但斌、吴悦风位列前5!翰荣、念觉领衔

私募排排网 浏览 1337

4400亿!中证A500指数基金一周年:总规模增近50%,近80家基金公司下场

券商中国 浏览 2142

1.5亿利润与12亿负债,祥源文旅为何景区造血,债务“起飞”?

华夏时报 浏览 1282
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1