Llama 3.1磁力链提前泄露!开源模型王座一夜易主,GPT-4o被超越
发布网友
发布时间:2024-08-18 14:11
我来回答
共1个回答
热心网友
时间:2024-08-22 20:04
开源模型界迎来重大变革,Llama 3.1磁力链的405B版本提前泄露,预示着模型王座可能易主。GPT-4o的领先地位受到挑战。
Meta的最新升级包括8B、70B和405B模型,所有版本的上下文长度提升至128K,标志着Llama 3.1的正式发布。405B模型的磁力链数据显示其大小为763.48GiB,性能超越预期。8B小模型表现出色,而70B模型甚至能与GPT-4o在多项基准测试中抗衡。
开发者们的反应热烈,Aidan McLau和Matt Schumer等CEO表示,如果405B的基准测试结果真实,它将打破多项记录,成为最优秀、可调用且价格亲民的模型。HyperWriteAI的预测是,Llama 3.1将成为开源模型的最高性能代表,性价比极高,明天的发布将引发广泛关注。
尽管扎克伯格的暗示和网友的期待,新模型的发布时间尚未确定,但泄露的Model Card显示Llama 3.1将在23日发布,提供定制商业和社区许可。这款模型支持多语言,包括英语和7种其他语言,旨在优化多语言对话并集成第三方工具。
基准测试显示,Llama 3.1 405B在多项任务上刷新纪录,特别是在MMLU和SQuAD等细分领域。微调后的模型在推理、代码等任务上表现出色,甚至在数学基准上超越GPT-4o。然而,安全风险评估也在进行中,包括对网络攻击的能力评估。
随着Llama 3.1的泄露和即将发布,开源与闭源模型之间的性能差距正在逐渐缩小,引发业界热议。对普通用户而言,820GB的模型大小可能是个挑战,但对技术爱好者而言,这将是一个见证历史时刻的激动时刻。