关闭广告

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

机器之心Pro10631人阅读



机器之心报道

编辑:蛋酱、陈萍

功能更强大的 Code Llama 70B 模型来了。

今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。



我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。

Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:

  • CodeLlama - 70B,基础代码模型;
  • CodeLlama - 70B - Python,专门面向 Python 的 70B;
  • Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。

Code Llama 最初是 Meta 在 2023 年 8 月推出的工具,免费用于研究和商业用途。

据 Meta AI 博客文章的介绍,Code Llama 70B 可比其他版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。

在 HumanEval 基准测试中,Code Llama 70B 的准确率达到了 53%,优于 GPT-3.5 的 48.1%,进一步接近 OpenAI 论文报告中 GPT-4 的 67%。



Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码并对人工编写的代码进行调试。发布之初,Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的,Code Llama 70B 也是如此。

当时 Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Meta 提供的 Code Llama 版本包括:

  • Code Llama,基础代码模型;
  • Code Llama-Python,Python 微调版;
  • Code Llama-Instruct,自然语言指令微调版。

其中,后面两个模型专注于特定的编码语言。现在这个模型大家族又加入了 Code Llama 70B,在代码任务上又提升了一个台阶。



Code Llama 70B 是在 1TB 的代码和代码相关数据上训练而成,托管在代码存储库 Hugging Face 上。

Meta 表示,其较大的型号 34B 和 70B 模型可返回最佳结果并提供更好的编码帮助。

但在开发者的使用体验中,Code Llama 70B 仍然存在明显不足。

比如有人发现,对于生成质数的请求,Code Llama 70B 无法完成:







也有人说,这一限制是为了避免某些不好的用途,比如生成非法质数。非法质数可以被用来表示一些禁止拥有或散布的资料,而依照美国的数位千禧年著作权法,散布这类程式是非法的。



参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

104岁老人一心赴死 安乐死中途突然睁眼吐槽"药效慢"

历史求知所 浏览 75518

财经作家、大V吴晓波被禁言

每日经济新闻 浏览 13655

"2年被家暴16次"女子再见丈夫:不敢看他的脸 全程发抖

封面新闻 浏览 69217

遭空袭后 胡塞武装"阴影领导人"佩刀出镜发出警告

环球人物杂志 浏览 11431

美媒:拜登在华沙发表言辞尖锐演讲 提了10次普京名字

环球网 浏览 229441

美联储如期暂停加息 暗示还会再加两次

网易财经 浏览 14179

猪价磨底,养一头亏168元!猪企主动去产能?4家下调出栏目标超800万头

时代财经 浏览 16099

汽车之家通过港交所上市聆讯 预计募资超10亿美元

财联社 浏览 24416

周迅不愧"人间香奈儿" 穿亮片装压轴看秀惊艳全场

时尚丽人风行 浏览 16316

不愧章子怡,竟瞒着他做出这么吓人的事

Yuki女人故事 浏览 8973

梁洛施疑和李泽楷一起参加婚宴 晒照曝光14岁长子

靓宁唠唠嗑 浏览 12555

比尔·盖茨,降落北京!“非常高兴能与中国的伙伴们见面”

每日经济新闻 浏览 14177

外媒:伊拉克阿萨德空军基地遭袭,10枚火箭弹飞来

环球网 浏览 23760

美媒:疑似美军潜水靴在距北溪管道泄漏点5米处被发现

每日经济新闻 浏览 86301

德国出台首份国家安全战略 称中国仍然是一个合作伙伴

环球网资讯 浏览 83992

天猫健康《诊疗家庭化消费趋势洞察》:连续血糖监测CGM消费规模升56.4%

网易科技报道 浏览 14917

这是来演戏还是拍时尚大片啊?

8号风曝 浏览 11627

科大讯飞发布星火V3.5大模型,董事长称“底座大模型需要国家队”

蓝鲸财经 浏览 10510

40岁的女人新年应该穿什么?试试这些养眼的穿搭,喜庆又高级

Yuki时尚酱 浏览 10570

京东物流上半年总收入778亿元,同比增长32.6%

网易科技报道 浏览 12412

被传与男顶流复合 周扬青无奈回应强调爱自己

网易娱乐 浏览 17908
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1