据通义千问官微11月3日消息,Qwen3-Max推理模型仍在持续训练中,即便是当前的Checkpoint,当借助工具调用和规模化的测试时计算时,模型可在AIME 25和HMMT25等具有挑战性的数学推理基准测试中达到100%的准确率。