关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11479人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

林峰受伤!拄拐现身曝受伤原因,吴千语施伯雄新疆秀恩爱!

缘木不求娱 浏览 12848

韩国宣布由韩企众筹为日本罪行埋单后 日本得寸进尺

新民晚报 浏览 102779

在7546米高峰上,一名女性登山者的月经难题

她刊 浏览 13560

赵久志:定义"新合资” 思皓新能源将开启黄金十年

网易汽车 浏览 21149

印度突发!已致122人死亡

中国基金报 浏览 10771

泰它西普治疗干燥综合征中国Ⅲ期临床研究成功入选

豹变 浏览 1582

赞比亚总统:没在北京反美也没在华盛顿反华 求别脱钩

澎湃新闻 浏览 13811

入秋第一条裤子就买它!时髦显瘦,巨好看!

Yuki女人故事 浏览 1988

为什么刘诗诗、倪妮这么有气质?体态赢了

LinkFashion 浏览 13333

美今夏发卫星欲跟踪中俄航天器?专家解读

环球网资讯 浏览 16549

中国汽车发动机新格局丨大众、丰田不再主流,谁主沉浮?

小鹏财经 浏览 1031

广汽集团曾庆洪:中国汽车市场将保持微增长,想“找死”的企业就早点降价

21世纪经济报道 浏览 16770

续航突破1000公里!李斌实测蔚来150度电池包,却被喷上热搜?

爱范儿 浏览 13075

美媒补刀:高市早苗挑衅中国 日本承受不起

澎湃新闻 浏览 12099

势如破竹拿下一众车企 特斯拉充电网络能否一统江湖?

科创板日报 浏览 15964

明抢!中国企业147亿半导体资产被荷兰政府冻结,CEO被停职;小米第三款车YU9多张实车谍照曝光;美团外卖骑手能屏蔽顾客了丨雷峰早报

雷峰网 浏览 1152

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 676

游戏行业卷在2023:四大趋势,两强争霸

定焦One 浏览 13252

全球芯片需求滑坡?有一处黄金赛道依旧“火热”:车用芯片

财联社 浏览 19217

AI把OpenAI内斗魔改成晋江文学,插图也能画,网友冲崩服务器

量子位 浏览 12811

法国任命最年轻总理 前任辞职时向马克龙表达心中不快

上观新闻 浏览 75291
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1