关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西12007人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

江中药业:激励计划部分业绩考核指标或“开倒车” 子公司财务数据或现“不同版本”

金证研 浏览 1361

E句话| 爱马仕继承人被曝坐廉航,150亿美元下落不明?

仙女事件簿 浏览 818

铜梁融媒:U16国足已抵达重庆备战,全力冲刺U17亚洲杯预选赛

懂球帝 浏览 1270

奥尼尔:大帝是我&大梦的结合 我看得上的内线只有他&文班&约基奇

直播吧 浏览 11457

阿邦拉霍:安东尼在球场上有点愚蠢,他应为自己的表现感到沮丧

直播吧 浏览 19213

给央视《小城大事》演技最好10位演员排名,赵丽颖第5,第1无争议

皮皮电影 浏览 298

程前向周鸿祎道歉:失态失礼,回头看自己都觉得不可原谅

网易科技频道 浏览 12825

奶茶冲泡巨头香飘飘“突围”:首家线下茶饮店将开业,曾多次试水快闪店

红星资本局 浏览 1532

学会这些穿衣窍门 变好看真的很简单

虎哥说衣不二 浏览 17830

有钱人变老了:“新中年”消费崛起前夜

巨潮WAVE 浏览 20044

山西6人上双大胜送福建3连败 邹阳18分新科状元11+9

醉卧浮生 浏览 290

泽连斯基:乌克兰度过了一个“非常艰难”的冬天

环球网资讯 浏览 19838

蚂蚁集团开发的超级机器人大脑:让机器人像人一样学会做任何事

科技行者 浏览 75

蓝佛安:财政工作要统筹国内与国际、发展与安全 政策制定要更有国际视野、更具前瞻性

财政部 浏览 11437

三节三双!东契奇前三节26中14砍下38分11板10助

直播吧 浏览 13564

沃尔沃新一代XC90曝光!年内首发,或首次国产,还看宝马X5?

网上车市 浏览 13130

北京算力巨头,掏150亿收购

21世纪商业评论 浏览 11397

8500万血亏?曼联新援0射门!单刀不射痛失绝杀+伤退致队少打1人

我爱英超 浏览 1291

埃迪-豪:弗兰克的球队无球时很有侵略性;英联杯对我们很重要

懂球帝 浏览 1333

9年17轮融资!市场份额仅0.6%佑驾创新赴港IPO,阿里CEO和四维图新都是股东

时代周报 浏览 11826

普京在莫斯科会见国务委员兼国防部长李尚福

新华社 浏览 116434
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1