Meta AI 研究院日前正式发布了 Llama 3.1 系列模型,该系列模型大约在 1 周前提前泄露,其中高达 4050 亿参数的版本被不少业界人士夸赞,因为能力方面已经超过 GPT-4 等非开放模型。
此次发布的模型分为三个版本,包括 Llama 3.1-8B 版、Llama 3.1-70B 版和 Llama 3.1-405B 版,这些模型均具有改进的 128K 上下文长度。同时 Meta 现在允许开发者使用 Llama 模型的输出来改进其他模型,也就是可以使用 AI 来训练 AI,某些张口闭口就是开放模型不如闭源模型的公司狂喜,估计已经下载模型开始训练自己所谓的闭源领先模型。
基准测试方面,Meta 在 150 多个基准数据集上评估了 Llama 3.1 的能力,还进行了几次人工评估以便将这些模型与现实场景中的其他模型进行比较。
测试显示 Llama 3.1-405B 版能力超过 GPT-4-0125、GPT-4o 和 Claude 3.5 Sonnet,这三个模型目前都是 AI 领域最顶尖的模型,而 Llama 3.1-405B 版已经提供相同或更好的能力。
基于测试结果 Meta 称 Llama 3.1-405B 是世界上规模最大、功能最强大的开放模型,而 70B 和 8B 版模型在与同参数模型也处于领先地位。
开发者们现在就可以通过 AWS、NVIDIA、Groq、Dell、Azure 和 Google Cloud 等平台使用 Llama-3.1 系列模型,其中 405B 版还可以通过微软 Azure AI 中直接调用。
开发者们也可以通过 Meta AI 官网下载这些开放模型,需要提醒的是开放不等于开源,个人、开发者和小规模的科技公司可以直接下载使用几乎没有法律问题,大型科技公司可能要仔细研究 Meta 的开放许可。
最后扎克伯格表示:
如今许多科技公司正在开发领先的闭源模型,但开源模型正在迅速缩小差距,去年 Llama 2 与闭源模型落后一代,而现在 Llama 3 已经可以与最先进的模型相媲美,并在某些领域处于领先地位。
从明年开始我们预计未来的 Llama 模型将成为业内最先进的模型,但在此之前 Llama 已经在开放性、可修改性和成本效率等方面处于领先地位。
以上就是“Meta发布Llama 3.1开放模型 最高4050亿参数 能力超过GPT-4等非开放模型”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网。
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/12328/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料
查 看2022高级编程视频教程免费获取