关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11790人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

现场直击|神舟21号升空前6小时,带你沉浸式追火箭!

上观新闻 浏览 1186

唐双宁被开除党籍 自称"擅长书法、略通金融"

每日经济新闻 浏览 75072

媒体:美方28点计划引全球哗然 泽连斯基将背负骂名

经济观察报 浏览 12878

特朗普顾问建议他"勿呼吁抗议" 担心"国会山骚乱"重演

环球网资讯 浏览 116766

高市早苗APEC会议期间与台湾地区人员会面 国台办回应

澎湃新闻 浏览 6430

美军高官炒作"打不通中方电话":中国军队太傲慢了

澎湃新闻 浏览 14800

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 169

15万也能开出头等舱质感,试驾锐胜M8

只懂车 浏览 537

夫妻带走无人照看的狗获刑 当公务员的妻子被停发工资

封面新闻 浏览 111797

王家卫持续被扒

萌神木木 浏览 1086

张若昀首谈女儿满脸宠溺,现场示范换尿布动作娴熟

趣看热点 浏览 26693

给黑洞拍“CT”,新方法有望筛选出最准确的宇宙引力法则

IT之家 浏览 1019

中邮基金换帅!权益规模下降,中邮核心成长混合为何业绩垫底?

Daily每日财报 浏览 517

泸州老窖停发国窖38度经典装4天后 经销商要涨价

红星资本局 浏览 11161

杨幂刘亦菲后同桌零互动,深扒两人闹僵原因

萌神木木 浏览 1166

VOGUE热捧刘亦菲被反噬,20周年众多大咖不出席,场面太尴尬!

萌神木木 浏览 1178

以色列议会初步通过吞并约旦河西岸法案 遭15国谴责

环球时报国际 浏览 6779

让新能源汽车“出得了城、下得了乡”,浙江将建成至少230万个充电桩

银柿财经 浏览 14842

特朗普:已开始从委石油资源中赚钱

环球时报国际 浏览 37

印媒:通过双航母军演 印度向外界表明自己在变强

参考消息 浏览 16561

广州白云机场出租车疑拒载多名短途乘客 官方介入调查

极目新闻 浏览 77671
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1