关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11963人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

倾家荡产120万上星光大道,她如今怎样了

青橘罐头 浏览 1534

秋季的穿衣难度并不高,选择基础款、配色不沉闷,舒适又减龄

静儿时尚达人 浏览 1570

两件大事刷屏!“924行情”即将一周年,下周市场会修复吗?

每经牛眼 浏览 2358

谢婷婷疑似恢复单身?独自带女儿送新年祝福,外籍老公3年没露面

素素娱乐 浏览 13469

翟欣欣涉敲诈勒索被逮捕 律师详解为何6年后才被立案

每日经济新闻 浏览 91750

自称窦骁前女友发声!内涵他目的性极强爱交富家女,很理解何超莲

萌神木木 浏览 1412

iPhone Air 2已在路上:升级2nm芯片 补齐影像续航短板

快科技 浏览 1169

乌代表团“换将”赴美 佩斯科夫:俄方只和美国谈

每日经济新闻 浏览 956

媒体:理想合并零售与交付两大部门 全力卖车

网易财经 浏览 11621

40+女人冬季穿衣,质感优先、简约配色、扬长避短,优雅高级

静儿时尚达人 浏览 285

男子家中冰箱门关不上灵机一动求助AI 差点花了冤枉钱

潇湘晨报 浏览 15679

美媒:特朗普已听取关于军事打击伊朗方案的汇报

新华社 浏览 315

孙俪参加大提琴英皇初级考试 开心晒成绩单获高分

娱絮 浏览 19316

金融监管总局:坚决落实强监管严监管要求,全面强化“五大监管”

国家金融监督管理总局 浏览 12364

米哈游去年赚了161亿!网友:够再开发十个《原神》了

品玩 浏览 17169

手握低空经济王牌矩阵 上海向世界eVTOL之都迈进

看看新闻Knews 浏览 313

西安市委书记方红卫任上落马 7月刚表态韩松被查

鲁中晨报 浏览 6566

张兰回应海外欠债9.8亿元:被资本算计 没欠任何人

每日经济新闻 浏览 106155

微博视界大会:杨幂丰满有料,白鹿珠圆玉润,迟蓬赢麻了

娱乐圈笔娱君 浏览 1236

上市15天,摩尔线程剑指英伟达腹地

虎嗅APP 浏览 728

也门胡塞武装承认在亚丁湾袭击美国船只并命中目标

海外网 浏览 12877
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1