关闭广告

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

机器之心Pro10025人阅读



机器之心报道

编辑:蛋酱、陈萍

功能更强大的 Code Llama 70B 模型来了。

今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。



我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。

Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:

  • CodeLlama - 70B,基础代码模型;
  • CodeLlama - 70B - Python,专门面向 Python 的 70B;
  • Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。

Code Llama 最初是 Meta 在 2023 年 8 月推出的工具,免费用于研究和商业用途。

据 Meta AI 博客文章的介绍,Code Llama 70B 可比其他版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。

在 HumanEval 基准测试中,Code Llama 70B 的准确率达到了 53%,优于 GPT-3.5 的 48.1%,进一步接近 OpenAI 论文报告中 GPT-4 的 67%。



Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码并对人工编写的代码进行调试。发布之初,Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的,Code Llama 70B 也是如此。

当时 Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Meta 提供的 Code Llama 版本包括:

  • Code Llama,基础代码模型;
  • Code Llama-Python,Python 微调版;
  • Code Llama-Instruct,自然语言指令微调版。

其中,后面两个模型专注于特定的编码语言。现在这个模型大家族又加入了 Code Llama 70B,在代码任务上又提升了一个台阶。



Code Llama 70B 是在 1TB 的代码和代码相关数据上训练而成,托管在代码存储库 Hugging Face 上。

Meta 表示,其较大的型号 34B 和 70B 模型可返回最佳结果并提供更好的编码帮助。

但在开发者的使用体验中,Code Llama 70B 仍然存在明显不足。

比如有人发现,对于生成质数的请求,Code Llama 70B 无法完成:







也有人说,这一限制是为了避免某些不好的用途,比如生成非法质数。非法质数可以被用来表示一些禁止拥有或散布的资料,而依照美国的数位千禧年著作权法,散布这类程式是非法的。



参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“泰坦”号背后:人类的深海探索到哪儿了?

新京报 浏览 13359

TF公司惹争议!邀请劣迹辱华韩星当导师,网友喊话别带坏风气!

萌神木木 浏览 8119

GPT Store来了,OpenAI着急让开发者赚到钱

态℃ 浏览 10005

在美流浪博士曾月薪10万美元:前妻拿到绿卡后和他离婚

上观新闻 浏览 64422

阚清子与一神秘男子牵手约会,疑似阚清子新恋情曝光

趣看热点 浏览 25549

女人不管年纪多大 穿裙子牢记“2要2不要”

猫姐品衣有道 浏览 16816

衬衫才是最高级的单品 不挑年纪不挑人

Yuki时尚酱 浏览 12033

会搭配的中年女人有多好看?推荐掌握这3点精髓,时尚显气质

静儿时尚达人 浏览 9952

适合微胖女人“不显胖”的穿搭,保暖不臃肿

静儿时尚达人 浏览 10124

“马丁靴”输惨了!冬天穿这3双巨洋气

In风尚 浏览 10631

碧桂园上半年权益销售221亿元,同比降82.84%

房财经 浏览 8203

俄军战术演练 7架安-124-100运输机同时升空

环球网资讯 浏览 10285

王思聪搂美女逛街,女方和前女友是闺蜜,00后女友疑似吃醋喊话

萌神木木 浏览 9684

43岁秦岚与40岁刘芸一起演戏,两人的差距不是年纪

娱哈星人 浏览 13221

人工智能成CES主角:巨头押注生成式AI,AI PC正式亮相

澎湃新闻 浏览 10311

延续家族设计 纯电轿车智己L6申报图曝光

网易汽车 浏览 10061

谁的责任?荷兰禁区7人“站桩”,克罗地亚轻松传中破门

直播吧 浏览 13686

亚足联官方:女足奥预赛中国队先客后主 4月8日开战

网易体育 浏览 23268

通勤度假都能穿的凉鞋,夏天时髦舒适就靠它了

春菇凉时尚穿搭记 浏览 13925

具俊晔上韩综吹牛:大S人气堪比全智贤

萌神木木 浏览 11931

《繁花》能为百雀羚业绩添花吗?

界面新闻 浏览 10393
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1