关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11679人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

西媒:西甲下周定是否通过签梅西计划,巴萨需削减2亿欧预算

直播吧 浏览 18832

京东工业港股上市首日平收,收报14港元/股,为刘强东第六家上市公司

红星资本局 浏览 536

章子怡任中戏表演系考官 考试现场轻松活泼

网易娱乐 浏览 19657

又见爆雷:业绩大降七成,股价跌超40%创新低

中国基金报 浏览 14986

疑似董小姐回应“牵手门”风波:做自己就好了

饭桶说史 浏览 16893

媒体:美国对台军售 本质是在加重中华人民共和国负担

新民周刊 浏览 6137

上市前三天,比特币现货ETF吸金不到9亿美元,“远远算不上成功”

华尔街见闻官方 浏览 12798

种粮大户给农民发1169万年终奖 "种粮状元"获超31万元

极目新闻 浏览 76122

两场硬仗,一个拐点,蔚来穿越最长谷底

雪豹财经社 浏览 1199

网络安全AI说丨警惕U盘里的“不速之客”

海外网 浏览 1849

男女网友见面2次后住酒店 女子称拒发生性关系遭强奸

极目新闻 浏览 75461

莫斯科官员:今年的红场阅兵 有种我从未见过的紧张

中国新闻周刊 浏览 121153

俄称在红军城打击被围困的乌军 乌称击退俄军进攻

环球网资讯 浏览 1011

国产英伟达88天闯关IPO!

诗与星空 浏览 1726

岚图泰山将于11月上市 4颗激光雷达加持/还有后轮转向

网易汽车 浏览 1209

扫码即飞!西安街头现身共享无人机

环球网资讯 浏览 966

小个子女生冬天怎么穿衣?上宽下紧、体现曲线,显高显瘦舒适

静儿时尚达人 浏览 530

发力高质量发展!全国人大代表李政:深耕高端制造,掌握更多核心科技

时代周报 浏览 19277

瑞银汪涛:2024年中国经济展望——在房地产下行中“企稳”

Wind万得 浏览 13121

马斯克与美国证交会达成协议 将向投资者赔偿4000万美元

财联社 浏览 14692

贾静雯练舞俩女儿陪伴,6岁波妞学妈妈跳舞腿好长

娱絮 浏览 16435
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1