关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11880人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

25岁西班牙女博主在相亲角被50岁男士求婚:感觉怪异

上观新闻 浏览 78686

美部署中导,王毅喊话俄罗斯,中俄肩并肩

浏览 11502

丁俊晖:来英锦赛心情和状态好;与特鲁姆普比赛是最难的

懂球帝 浏览 871

诺基亚回应vivo暂停德国市场销售:期待谈判

第一财经资讯 浏览 16981

在线人数暴跌98%,股价跌去20% 陈向东回应高途坠落凡间

鞭牛士 浏览 13150

媒体:一份非官方的美国就业数据 把美国投资者吓坏了

财联社 浏览 6113

外媒:安世半导体已暂停向中国工厂供应晶圆

澎湃新闻 浏览 12205

曹云金力挺董宇辉称赞俞敏洪 疑在内涵郭德纲?

郑丁嘉话 浏览 13444

星光伴我心,不朽迷影佳作今晚点亮大银幕!

幕味儿 浏览 629

中方宣布制裁对台军售美企,制裁力度历史罕见

趣看热点 浏览 26395

李沁,一款全方位健康的“老式小孩”

时尚COSMO 浏览 2421

库里本季下半场场均15.2分 比第二得分手克莱场均得分仅差1分

直播吧 浏览 13016

最好的相互救赎,我在《秋雪漫过的冬天》看见了

仙女事件簿 浏览 190

倪萍又说大实话,感叹李施嬅爱情里像“当妈”

疯说时尚 浏览 1244

极氪右转:为何回归一个吉利?

天天汽车 浏览 1292

超频三 RT620Pro TC ARGB 风冷 239 元上市,配备家族化一体顶盖

IT之家 浏览 1544

Adobe Research突破:AI实现材质与物理特性视觉感知

科技行者 浏览 6

AI数据中心太火,美商务部长被盯上了,民主党议员发函敦促调查利益冲突

华尔街见闻官方 浏览 645

法甲官方第26轮最佳阵:梅西、姆巴佩在列,巴黎四将入选

直播吧 浏览 19706

币圈大佬的重生:特朗普特赦赵长鹏

节点财经 浏览 1353

塞尔记者:维尼修斯迎来绝佳机会,皇马希望主场球迷不要嘘他

懂球帝 浏览 387
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1