出品|虎嗅科技组成人 男同
作家|孙晓晨
剪辑|苗正卿
头图|视觉中国
当地时间4月5日,Meta推出其迄今最为强盛的开源AI模子Llama 4系列,其首批推出的Llama 4系列模子包括Llama 4 Scout和Llama 4 Maverick。此外,还有更为强盛的Llama 4 Behemoth仍在检修中。
据Meta先容,Llama 4 Scout包含170亿活跃参数、16个众人模子及1090亿总参数,在多样正常接受的基准测试中,性能优于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。Llama 4 Scout的援手高下文长度为1000万token,这将为AI模子的功能翻开新的可能,如多文档摘记,理会大限制用户活动以进行个性化任务,以及在弥远的代码库中进行推理。
而Llama 4 Maverick也领有170亿活跃参数,可是其众人模子数目增至128个,总参数目为4000亿。该模子据称领有顶尖的图像定位能力,可将用户提醒与相关视觉观点精确对都,并将模子反馈锚定到图像中的特定区域。Meta示意,Llama 4 Maverick在多项主流基准测试中,全面超越GPT-4o与Gemini 2.0 Flash;在活跃参数仅为其一半的情况下,该模子在推理与代码能力方面完了了与DeepSeek V3同等性能;其聊天版块在LMArena测试中赢得1417的ELO评分,领有无与伦比的性价比。
Llama 4 Scout和Llama 4 Maverick均从Llama 4 Behemoth中蒸馏而来,而Llama 4 Behemoth据称包含2880亿活跃参数、16个众人模子以及2万亿参数。Meta示意,Llama 4 Behemoth为其迄今为止最强盛的模子,且尚在检修中,当今在STEM边界的基准测试中泄漏优于GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro。
在官网博文中,Meta共享了对于Llama 4系列模子的时刻细节:
该系列模子为首批罗致混杂众人(MoE)架构的模子,其在检修和推理时推测打算恶果更高,且在相似的检修FLOPs预算下,或者生成更高质地的限度。
此外,Llama 4罗致原生多模态设想,融入早期交融时刻,将文本和视觉美艳无缝集成到和洽的模子主干中。Meta称:“早期交融是一个要紧的向上,因为它使咱们或者使用多数未美艳的文本、图像和视频数据对模子进行聚拢预检修。”Llama 4的视觉编码器也得到更正,以更好地相宜大言语模子。
在模子检修流程中,检修团队罗致了名为“MetaP”的新式检修时刻,或者可靠地缔造关键模子超参数(如各层学习率和驱动化限制)。Llama 4通过预检修援手200种言语(其中100多种言语的检修美艳量杰出10亿个),全体多言语检修美艳量较Llama 3培植10倍,为开源社区的模子微调责任奠定了坚实基础。
Meta还通过其他一系列动作对模子进行检修和完善,如罗致FP8精度以进行高效模子检修、罗致“中期检修”的形状不息检修模子以培植模子中枢能力等。
2018无限资源在线视频模子安全亦然Meta眷注的要点,其在博文中称“咱们的筹办是开荒最有匡助和最有用的模子,同期看重和松开最严重的风险。咱们按照咱们的《开荒者使用指南:东说念主工智能保护》中抽象的最好试验来构建 Llama 4。这包括在模子开荒的每个层面(从预检修到后检修)整合缓解要领,以及可调度的系统级缓解要领,以保护开荒者免受顽抗性用户的影响。”
2025年以来,DeepSeek R1、Grok 3、GPT-4.5繁多模子接连推出,束缚刷新数据,如今Llama 4又强势入场,宣称碾压GPT-4.5,可见这场模子之战更加热烈。看成开源大模子,Llama 4系列模子展现了Meta对开源计谋的坚抓。Meta首席实施官扎克伯格示意:“他们的筹办是竖立寰宇率先的东说念主工智能,将其开源,并使其普遍可用,以便寰宇上每个东说念主都能受益。”逢迎DeepSeek带来的冲击以及OpenAI日益明显的开源倾向,AI公司对开源计谋似乎照旧更加招供。可是濒临OpenAI等繁多竞争敌手,Meta能否通过开源计谋构建灵验生态壁垒,Llama 4 Behemoth能否助其在“万亿参数俱乐部”中占据率先地位,还尚未可知。
本文来自虎嗅,原文流畅:https://www.huxiu.com/article/4207107.html?f=wyxwapp