关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11822人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

巴勒斯坦新男模出道 被Bella Hadid认干弟弟

下水道男孩 浏览 17220

反卷与新秩:中国厨电已走向未来

市值Observation 浏览 14767

德雷森:格雷茨卡本赛季不走;我们将择机与凯恩开启续约谈判

懂球帝 浏览 176

加斯佩里尼:意甲争冠?我知道有一些实力更强的球队

懂球帝 浏览 590

兴业消费金融:筑梦美好生活 扎实推进高质量发展

财经众议院 浏览 265

太子集团创始人陈志被遣送回国 外交部回应

财联社 浏览 10572

暴跌超70%!"扫地机器人鼻祖"破产 中国债主或接盘

华尔街见闻官方 浏览 589

美国史上首次 前总统特朗普将于下月接受刑事审判

财联社 浏览 82265

看一看“不费力”的早春穿衣小技巧,简单体面,适合40+女人

静儿时尚达人 浏览 13289

奈飞联合创始人向慈善机构捐赠所持四成股权,价值超11亿美元

澎湃新闻 浏览 12877

冬天要有的鞋子!显高!显腿长!还显瘦!

Yuki女人故事 浏览 973

苹果新款13、15英寸MacBook Air笔记本电脑有望在春末夏初到来

IT之家 浏览 19339

邮报:利物浦前员工涉及多年球票欺诈勾结黄牛牟利,审判已开始

懂球帝 浏览 1212

媒体:特朗普一口气狂退66个群 还有更多在"排队"审查

上观新闻 浏览 11114

互相拳打脚踢!足协官方:中乙球员李灵威、李镇全停赛3场罚1.5万

直播吧 浏览 14911

刚说淘汰中国激光雷达,最后希望的 Luminar 就破产了?

差评XPIN 浏览 534

乌官员证实美乌代表将在迈阿密再次会晤

北青网-北京青年报 浏览 799

西班牙诞生世界首个带新冠病毒抗体的婴儿,医生是这样说的

趣看热点 浏览 969962

4399元 一图读懂OPPO Find X9 刘作虎:严重超标的标准版

快科技 浏览 1409

英超第8轮最佳球员候选:马奎尔、哈兰德、萨卡、内托在列

懂球帝 浏览 1305

我永远不会买黄金,更不会投资黄金!

浏览 23676
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1