马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜
据了解,马斯克发布Grok 4.1,同时霸榜大模型竞技场的第一和第二。Grok 4.1思考模式以1483的Elo分数稳居榜首,领先非xAI模型中的最高分整整31分。Grok 4.1非思考模式以1465分拿下第二名,超越了公开排行榜上所有其他模型的完整推理模式。在大模型竞技场新推出的专家榜和职业榜上,Grok 4.1思考模式同样霸榜。Grok4.1目前只在文学榜上输给Gemini2.5,数学榜输给Claude4.5和o3,其他六个榜单均拿下第一。
文章评价
匿名用户
发布
发布