本报记者 龚梦泽
2月18日,埃隆·马斯克旗下人工智能初创公司xAI正式发布新一代聊天机器人Grok 3(聊天机器人)。马斯克在发布会现场表示,Grok 3在很短的时间内超越了上一代,比Grok 2强大一个数量级。资料显示,xAI公司于2023年7月份成立,半年后发布Grok和Grok 1.5模型,随后又在去年8月份发布了Grok 2。
国金证券认为,国产大模型开启了全球大模型开发和应用的新阶段,开源模型的高性价比和低训练成本极大地降低了大模型的投资、开发、运营成本,降低了融合应用的技术门槛,为千行百业智能化广泛落地提供了更多可能,包括端侧AI、聊天机器人、自动驾驶等在内“AI+X”有望带动传统行业和终端产品的升级浪潮。
引入“思维链”能力即将开源
根据马斯克在直播中演示的内容,Grok 3在数学、科学、编程三项能力的相关测评中得分均高于谷歌Gemini模型、Anthropic的Claude模型和OpenAI的GPT-4o模型。
马斯克表示,该聊天机器人经过了合成数据的训练,能够通过重新分析信息来反思自己的错误,从而获得更好的逻辑一致性。据悉,Grok 3最大的亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题。
“Grok 3的计算能力是Grok 2的10倍以上。”马斯克说道,“我们每天都在不断改进模型。”目前,Grok 3测试版现已面向社交媒体平台X Premium用户推出。他还表示,一周后该模型将会获得最佳体验。
记者观察到,从直播中公开的Grok 3用户交互界面来看,除了中心的对话框可进行对话问答外,对话框下还有“深度搜索”“思考”“大脑”“研究”“数据分析”“图像创造”等按钮。谈及运行模式,马斯克明确表示,将在数月后对Grok 3进行全面开源,之后的节奏将是“发布一个新版本后开源上一版本”。
xAI团队还首次透露,目前已经启动了下一个阶段的AI集群构建,“比Grok 3更好的模型必须在深度学习科学和工程的各个方面都表现出色,但这绝非易事。”团队在直播中称,“我们已经开始研究下一个AI集群,它将较目前的集群强大约5倍。”
大模型竞争将激发创新浪潮
近段时间,随着国产大模型发布其最新开源产品在国内外引发热烈关注,百度智能云、腾讯云、阿里云、华为云等多平台宣布上线开源大模型产品。
“国产大模型通过开源策略、低成本高效推理及强化学习结合混合专家架构(MoE)等创新,实现了突破性的技术进展。”赛智产业研究院人工智能研究所副所长安赟表示,开源打破了大企业的技术垄断,促进了AI技术的普惠化。其低成本的算法优化模式改变了长期以来对算力堆砌的依赖,推动了效率导向的竞争格局。
与此同时,凭借低成本和高效推理模式国产大模型也影响到了AI产业的上下游,并波及资本市场。在制造业领域,有助于工厂实现生产流程优化与质量控制;在金融领域,有效提升AI模型驱动风险评估效率;医疗行业中,通过AI辅助诊断会缩短诊疗周期。此外,政务、教育、交通等领域通过大模型实现数据驱动的决策支持,将推动效率与服务质量双提升。
国金证券认为,如果说2023年是AI训练的元年,2024年是AI推理的元年,那么2025年将是AI终端应用爆发的元年。国产大模型开启了全球大模型开发和应用的新阶段,持续看好AI基础设施,重点关注AI应用。
(编辑 乔川川)