关闭广告

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

机器之心Pro5044人阅读



机器之心报道

编辑:蛋酱、陈萍

功能更强大的 Code Llama 70B 模型来了。

今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。



我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。

Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:

  • CodeLlama - 70B,基础代码模型;
  • CodeLlama - 70B - Python,专门面向 Python 的 70B;
  • Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。

Code Llama 最初是 Meta 在 2023 年 8 月推出的工具,免费用于研究和商业用途。

据 Meta AI 博客文章的介绍,Code Llama 70B 可比其他版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。

在 HumanEval 基准测试中,Code Llama 70B 的准确率达到了 53%,优于 GPT-3.5 的 48.1%,进一步接近 OpenAI 论文报告中 GPT-4 的 67%。



Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码并对人工编写的代码进行调试。发布之初,Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的,Code Llama 70B 也是如此。

当时 Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Meta 提供的 Code Llama 版本包括:

  • Code Llama,基础代码模型;
  • Code Llama-Python,Python 微调版;
  • Code Llama-Instruct,自然语言指令微调版。

其中,后面两个模型专注于特定的编码语言。现在这个模型大家族又加入了 Code Llama 70B,在代码任务上又提升了一个台阶。



Code Llama 70B 是在 1TB 的代码和代码相关数据上训练而成,托管在代码存储库 Hugging Face 上。

Meta 表示,其较大的型号 34B 和 70B 模型可返回最佳结果并提供更好的编码帮助。

但在开发者的使用体验中,Code Llama 70B 仍然存在明显不足。

比如有人发现,对于生成质数的请求,Code Llama 70B 无法完成:







也有人说,这一限制是为了避免某些不好的用途,比如生成非法质数。非法质数可以被用来表示一些禁止拥有或散布的资料,而依照美国的数位千禧年著作权法,散布这类程式是非法的。



参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

工作人员霸占电脑拒给群众办证 官方:调离工作岗位

每日经济新闻 浏览 49347

复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐

新智元 浏览 8966

冲突以来驻中东美军首现死亡 拜登誓言"作出回应"

环球网 浏览 5066

恋情实锤!杨洋王楚然被拍到在酒店幽会四天三夜

盖饭娱乐官方号 浏览 11415

中南双能卫渴望逐梦CBA:希望能冲击下 想去宏远

网易体育 浏览 9804

邱礼涛,为香港电影续命。

幕味儿 浏览 3257

辞职联合国官员:美英是对巴勒斯坦人"种族灭绝"同谋

环球时报国际 浏览 40404

萨哈:拉什福德去哪都要改变,就像当年纳尼和C罗就存在差距

懂球帝 浏览 4831

李凯尔晒与家人合照:特伦蒂诺的家庭时光 热爱我们的生活

直播吧 浏览 7504

外媒:乌防长或因腐败准备辞职 泽连斯基陷入两难

环球网资讯 浏览 6929

Sam Altman、Hinton中国首秀!国内最硬核AI内行盛会圆满闭幕,国产大模型「悟道3.0」全面开源

新智元 浏览 8948

AI大模型用鲁迅风写高考作文,大家来品品能打多少分

量子位 浏览 9166

抖音重点打击泄露隐私、P图公开辱骂等网暴言论

网易科技报道 浏览 3527

江恩:什么是波段操作的铁律?3条准则看似简单,95%的人却做不到

60秒商业解读 浏览 4778

手机行业的上半年:卷不动了,家家开始挤牙膏

钛媒体APP 浏览 7907

字节商业化新调整:懂车帝将成为独立公司

晚点LatePost 浏览 5148

吉利豪越系列新成员曝光 豪越PRO将于1月上市

网易汽车 浏览 5257

赴港开户热潮再起:有人排队7小时 黄牛2880元代预约

中新经纬 浏览 53125

“价格战”才能凸显凯美瑞的高价值所在

汽车公社 浏览 4691

追星太离谱!路人厕所偶遇权志龙,盛赞其衣品,未受涉毒风波影响

萌神木木 浏览 5384

23年前冰柜藏尸案告破,一个塑料袋成为破案关键

趣看热点 浏览 120490
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1