酷无极 - CooLWJ

10:26 新浪新闻鞠婧祎白发狐狸造型

10:26 新浪新闻孙颖莎回应自己的局点才是局点

10:26 新浪新闻张志磊憾负卡巴耶尔

10:26 新浪新闻十个勤天福州演唱会

10:26 新浪新闻 42岁张志磊遭TKO后戴氧气罩离场

10:26 新浪新闻男子散光眼将糖葫芦摊认成棺材起灵

10:26 新浪新闻全民网购，实体店的未来在哪里

10:26 澎湃新闻马上评｜政务系统接入DeepSeek，当把握好三对关系

10:26 澎湃新闻 2025年全国两会即将召开：委员拟建议制定统一的反网暴法

10:26 东方财富中美经济高层沟通释放了三重信号

10:26 虎嗅 OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性。

近日，OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此，xAI的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。xAI的图表显示，Grok3的两个版本——Grok3Reasoning Beta和Grok3mini Reasoning——在AIME2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。

然而，OpenAI的员工很快在X平台上指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME2025得分。巴布什金在X平台上辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

🔥热榜：2025-02-23

历史热榜