关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11967人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

才播6集热度破8900,悬疑剧有天花板了

娱乐圈笔娱君 浏览 1272

环球:美国在中国周边下"巨大赌注" 一定会亏

环球网资讯 浏览 16230

OpenAI “宫斗”大戏调查结果公布,官方宣布新董事会成员

第一财经资讯 浏览 13087

长安林肯航海家燃油 SUV 新增“启航版”上市,24.59 万元

IT之家 浏览 2058

租电版售价5.28万元 埃安UT系列永冲锋版上市

网易汽车 浏览 181

汉朝哪位皇后被奸人所害打入冷宫?

趣看热点 浏览 26612

有气质的40岁女人都喜欢低马尾和微卷发

成铭聊发型 浏览 20488

独家对话招行行长王良

21金融圈 浏览 11958

男子50多万买66台苹果手机放平台出租 如今钱机都没了

潇湘晨报 浏览 6048

泰国外长:泰柬将于12月24日举行会谈 讨论停火细节

财联社 浏览 678

董宇辉新号首播提"丈母娘" 俞敏洪:他若离职账号归他

中国新闻周刊 浏览 75968

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技 浏览 345

美国国务院要求美国公民立即离开伊朗

新华社 浏览 272

早春第一条裙子这样搭,显瘦显高还不挑人!

她暖 浏览 20341

发现新疆戈壁"为人民服务"标语遭破坏 博主决定去修复

极目新闻 浏览 7044

公募人困在流言与焦虑里

北京商报 浏览 13032

俄就黑海"撞机"事件向苏-27战机多名飞行员颁奖

环球网 浏览 19713

众望所归!诺兰凭《奥本海默》 获最佳导演

网易娱乐 浏览 12627

这些才是适合普通人的穿搭!多穿基础款和半身裙,简约又得体

静儿时尚达人 浏览 1259

59天后的春晚,她必是焦点

Yuki女人故事 浏览 697

美军高官炒作"打不通中方电话":中国军队太傲慢了

澎湃新闻 浏览 14940
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1