关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11929人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

比亚迪重金奖励举报腐败行为,最高500万元!

红星新闻 浏览 14837

克雷马斯基:我们在努力吸收梅西所说的一切,因为他是最好的球员

直播吧 浏览 14586

荷兰主帅科曼:选贝尔温首发是想让他在右边路多深入内线

直播吧 浏览 11113

大厂秋招又起:为什么“ATMD”成第一梯队

三言科技 浏览 14518

售价更低 零跑Lafa5无激光雷达版申报信息曝光

网易汽车 浏览 1592

红海危机持续发酵 著名咨询公司警告:供应链受损程度已显著超过疫情早期

智通财经 浏览 13437

源杰科技市值640亿,光芯片竞争激烈,如何撑起高估值?

尺度商业 浏览 263

Prada陷入代言人魔咒,品牌代言人该如何选择?

营销兵法 浏览 16816

吴尊打篮球鼻梁受伤流血,在线求助自曝伤口很深

叶公子 浏览 15012

美日印澳4国大使北京会谈 不到24小时印度向中国示好

南宫一二 浏览 15498

金融文化实践录丨深耕特区发展沃土 厚植金融文化根基

证券市场周刊 浏览 1259

21岁女子被父亲安排嫁给姐夫 丈夫指责其不如姐姐贤惠

花点时间 浏览 92677

东风本田10月销量28896台 1-10月累计终端销量255073台

网易汽车 浏览 1262

也门胡塞武装承认在亚丁湾袭击美国船只并命中目标

海外网 浏览 12862

美股周二:三大股指重跌2%,特斯拉市值蒸发2300亿元,京东跌超11%

网易科技报道 浏览 19325

小米YU7内掏出不明零件最新进展 市监局介入处理

网易汽车 浏览 1371

广西餐桌上的硬核美食,广东人都得甘拜下风

YOKA网 浏览 13761

季后赛里谁才是篮网真老大?篮网三巨头的实力

趣看热点 浏览 26012

周雨彤穿"真空蝴蝶结" 巴掌腰抢镜

学霸知识局 浏览 20332

实探封关后的海南三亚:消费者无法全岛"零关税"购物

第一财经资讯 浏览 561

她们冬天这样穿,真的很美!

黎贝卡的异想世界 浏览 497
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1