关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西12031人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄军近乎包围巴赫穆特 乌军指挥官称前线"像地狱"

澎湃新闻 浏览 102908

52岁胡兵在伦敦时装周开场+闭秀,宝刀未老太帅啦

时尚丽人风行 浏览 17624

女主播被伪装的炸弹包裹炸伤:拿起看了一眼就爆炸了

极目新闻 浏览 5901

日本海滩现巨大“神秘球” 海保人员疑惑:从没见过

海外网 浏览 19836

关于软件/代码生成的思考

极客公园 浏览 11443

冯德莱恩称欧洲愿继续与乌美合作 强调安全保障重要性

国际在线 浏览 656

英伟达参投!AI创企Cohere融资2.7亿美元,OpenAI的强力对手

智东西 浏览 16669

“中国肝胆外科之父”吴孟超去世,他创建我国肝脏外科论基础

趣看热点 浏览 26271

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 1264

5月16-24岁劳动力调查失业率为20.8%

国家统计局 浏览 16847

美媒披露普京停火条件:基辅必须彻底放弃顿涅茨克

参考消息 浏览 1601

69岁赵雅芝真实面容曝光 生图眼尾皱纹炸花显老态

盖饭娱乐官方号 浏览 19706

聚焦精准营养!英氏控股以科研创新引领婴幼儿辅食产业升级

时代周报 浏览 763

中年男子在儿子自杀后潜入"约死群" 多次碰到"劝死者"

剥洋葱people 浏览 123936

夏天少穿短裤、短裙,跟着气质女神穿衣服,才能美得优雅得体

静儿时尚达人 浏览 11674

江淮受累于大众安徽亏损,受惠于尊界S800热销

道哥说车 浏览 322

11个月来首次进球,丹尼-英斯结束32场进球荒

懂球帝 浏览 12411

内娱抄了他20年,这回终于赢了

独立鱼 浏览 19542

铜师傅的资本突围与增长焦虑

北京商报 浏览 1031

零跑汽车10月销量破7万台

三言科技 浏览 1222

以高官不满拜登“没全力”支持以军:换成特朗普会更好

环球时报国际 浏览 12941
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1