关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11995人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今天 | 送别杨振宁!群众含泪相送!队伍望不到头!

天津广播 浏览 1466

3岁男孩跌入炭堆全身烧伤85%尚未脱险 家人发声

封面新闻 浏览 6904

东风奕派2026款纳米01、2026款eπ008五座版上市

网易汽车 浏览 1600

72岁赵雅芝1588生日会门票秒没,网友:人傻钱多

港剧叔 浏览 1661

71岁上海爷叔网恋"小姑娘"转30万 约会遭对方持刀勒索

上观新闻 浏览 15642

“中国肝胆外科之父”吴孟超去世,他创建我国肝脏外科论基础

趣看热点 浏览 26235

韩国女艺人朴秀莲从楼梯摔落脑死亡去世 年仅29岁

篁竹书 浏览 16318

本田推出首款可横跨美洲大陆的轻型公务机,2028年实现商业化

IT之家 浏览 16964

万达谜局:高息债务压顶 仍花400亿买理财

锋雳 浏览 17084

美军新锐舰队为应对中国大举集结 集结地却远在夏威夷

枢密院十号 浏览 5917

单奖约725万!8位学者获这项大奖,两人贡献涉及高温超导材料

每日经济新闻 浏览 15322

听说,好多人都在等着彭小苒大火

时尚COSMO 浏览 779

掘金G3大胜热火!约基奇穆雷统治内外,布劳恩奇兵,双波喜忧参半

篮球资讯达人 浏览 17025

周杰伦的稻香是写给汶川地震的

趣看热点 浏览 27298

喜欢看他穿高叉泳衣!

下水道男孩 浏览 17241

深圳自动驾驶安全实验室揭牌成立,将重点攻坚十大方向

南方都市报 浏览 267

秋天穿阔腿裤,选对鞋子才时髦!

LinkFashion 浏览 15774

50、60岁的女人就要这么穿!自然老去,不扮嫩反而更美了

静儿时尚达人 浏览 1571

潘德夫:这是我退役后第一场11人制比赛,希望队友下次能聚齐

懂球帝 浏览 12754

莫斯科市长称击落两架飞往莫斯科的武装无人机

环球网资讯 浏览 15003

杨鸣:广东三外援轮番冲击让我们顾此失彼;今晚年轻人的表现值得表扬

懂球帝 浏览 392
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1