关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10323人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

52万元起售,电动Jeep想要“硬刚”特斯拉

上海汽车报 浏览 9690

红毯再现女星风采 秦岚造型真大胆

御姐风尚志 浏览 14743

赵明剑、张兴博离开石家庄功夫,转会东莞莞联

直播吧 浏览 14243

Adobe 200亿美元收购案告吹:给Figma 10亿美元分手费

雷递 浏览 11899

爱女回国,李湘与王诗龄同框似闺蜜

娱絮 浏览 18098

尼日尔政变军人指责法国侵犯其领空,法方否认

界面新闻 浏览 13173

最近这件衬衫很火 一定要试试这样穿

她暖 浏览 15841

这几位“姐系美人”从体态就开始卷?

ELLE世界时装之苑杂志 浏览 18536

女子和前男友约会过夜 现男友在楼下守到半夜急到报警

汉史趣闻 浏览 87321

漫画照进现实!近江教练:青森山田是灌篮高手的山王,我们像湘北

直播吧 浏览 11763

王诗龄晒国外贵族学校宿舍照,4人间又小又拥挤

娱小菡 浏览 18296

台外事人员被指烧瑙鲁国旗"泄愤" 台外事部门回应

环球时报新闻 浏览 11465

买羽绒服,“国货”和“外国货”不能选错!不光钱的事,而是品质

潮人志Fashion 浏览 11875

美国总统拜登签署对华投资限制行政令 外交部回应

财联社 浏览 85336

最后劝你一次,小个子别再穿阔腿裤

八只爪的猫 浏览 18256

美监管部门:对特斯拉Autopilot长达两年调查即将结束

网易科技报道 浏览 13197

索要1000万元逼死丈夫苏享茂 翟欣欣一审获刑12年

界面新闻 浏览 10556

陕西延安致11死瓦斯爆炸事故细节披露:抽烟点火引起

新京报 浏览 68962

巴基斯坦与沙特阿拉伯签军事协议 多国受震动

环球网资讯 浏览 330

梁洛施携家人聚餐,14岁大儿子正脸曝光像李泽楷

青芳草 浏览 14275

53岁窦唯近况曝光:老丑邋遢?

影像温度 浏览 18470
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1