OpenAI 员工指责 xAI 的 Grok3 基准测试结果具有误导性
Bitget消息,据 ChainCatcher 报道,OpenAI 的一名员工指责 xAI 公司发布的 Grok3 基准测试结果具有误导性。xAI 联合创始人伊戈尔・巴布什金坚称公司并无不当。
xAI 的图表显示,Grok3 的两个版本在 AIME 2025 上的表现超过了 OpenAI 的 o3-mini-high。然而,OpenAI 员工指出,图表未包含 o3-mini-high 在“cons@64”条件下的得分。
巴布什金辩称,OpenAI 过去也曾发布过类似的基准测试图表,用于比较其自身模型的表现。