2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月18日12点)正式发布,并且会同步进行现场演示。马斯克对Grok 3的赞誉毫不吝啬,称其为 “地球上最聪明的人工智能”,其推理能力将超越包括ChatGPT和DeepSeek在内的其他领先AI模型。据悉,为了确Grok 3在发布时能够呈现出最佳状态,马斯克透露,整个周末他都将与团队成员并肩作战,全身心投入到产品的打磨工作中。
Grok大模型是马斯克旗下的xAI公司推出的新一代人工智能模型,2023年11月,xAI发布第一款大模型Grok-1,迈出了在大模型领域探索的第一步。2024年3月18日,xAI团队又推出了参数量高达3140亿的Grok-1模型,这一参数量远超OpenAI GPT-3.5的1750亿,成为当时参数量最大的开源大语言模型。
2024年8月,Grok 2大模型发布 。Grok 2主要应用于训练AI聊天机器人。与Grok 1相比,它在训练数据的使用上有所改进。Grok 1在训练时未完全依赖真实世界数据,采用了大量合成数据,导致在处理真实世界中的细微差别和复杂性时表现欠佳。而Grok 2虽然依旧使用了大规模合成数据集,但同时融入了少量高质量的真实世界数据,在一定程度上弥补了初代模型在处理真实场景方面的不足。
而此次即将发布的Grok 3,其最大的特点在于引入了“思维链”(Chain Of Thought)推理能力。该能力让Grok 3能够像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应的能力。Grok 3模型在推理、编程能力以及文本和图像分析等多模态功能方面有了显著的提升。
去年夏天,马斯克便在社交平台X上高调宣布,Grok-3将依托10万张英伟达H100 GPU的超强算力进行训练,彼时计划在2024年底推出,并称赞其 “将会是非常特别的”。但现实却事与愿违,Grok-3的发布进程受阻。业内分析,xAI团队规模相对较小,在人力、资源调配等方面可能面临诸多挑战,这在一定程度上拖慢了项目的推进速度。
在人工智能大模型领域,竞争态势瞬息万变,每一次新品发布都可能重塑市场格局。在Grok 3推迟发布期间DeepSeek异军突起,迅速抢占市场份额,成为AI领域的一匹黑马。 此次Grok-3姗姗来迟,如今市场格局已发生变化,Grok-3能否在竞争激烈的市场中分得一杯羹还未可知。