关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11950人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥特曼:我被开除又回来很痛苦 但对OpenAI是好事

网易科技报道 浏览 13502

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 1293

媒体:国产"双尾蝎"编队试飞视频首公开 三点值得关注

枢密院十号 浏览 91790

五一档头条的网友竟然都不看好《你的婚礼》这部电影?说演员没有一个认识的

趣看热点 浏览 27639

夸克AI眼镜开售,88VIP叠加9折消费券,最低3329元

海外网 浏览 1529

特斯拉闪电涨势即将结束?股价大跌超6%,多家大行下调评级

澎湃新闻 浏览 16149

高市早苗成功"策反"对手 分析称其当选首相几乎成定局

红星新闻 浏览 5235

没补贴、收购置税,新能源车好日子到头了?现实会打服“恨电派”

小李车评李建红 浏览 2083

21岁美“泄密门”主角庭审全程表现安静

环球网 浏览 19570

雅图高新被举报后发长文反驳:谁是谁非需捋清 北交所非“垃圾箱”IPO企业非出气筒

财经下午茶 浏览 1295

马莱莱破门后重伤退场!或锁骨骨折,媒体人:受伤也会挑时间

奥拜尔 浏览 12769

专家:美对华贸易姿态是战略性失败 不再掌握全球霸权

澎湃新闻 浏览 30182

一笑随歌李沁陈哲远短短37秒吻戏床戏都上尺度了

陈意小可爱 浏览 1492

多国欢迎加沙停火协议生效 呼吁尽快结束人道主义危机

上观新闻 浏览 1557

皮肤衣到底是防晒神器 还是虚有其表?

一帐Camplus 浏览 20039

看了赌王四房大女儿的近照,才知道金钱买不来“贵气”

不八卦会死星人 浏览 11373

L4级自动驾驶到来之际,奔驰还要继续领先

汽车公社 浏览 740

媒体:韩突然向日伸出橄榄枝后 中美的表态意味深长

北京日报客户端 浏览 20031

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

伊周潮流 浏览 405

针织+半裙,秋天最经典搭配,好看又减龄!

LinkFashion 浏览 2525

脑瘫男子开厂养活35名残障员工 站上"感动中国"舞台

都市快报橙柿互动 浏览 99925
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1