🔥51CTO热榜：2025-07-24

一项来自普林斯顿和伯克利的重磅研究揭露了AI的胡扯本质。从空洞修辞到误导性半真话，AI如何用花言巧语掩盖真相？快来看「胡扯指数」如何量化AI的忽悠能力！

根据用户在事后用 AI 辅助完成的技术分析，这场灾难的根源始于最初那个 mkdir 命令。在 Windows 中，如果目标文件夹已存在，mkdir 会返回错误。但 Gemini 似乎没有正确解析命令返回值，错误地将这次操作视为成功。

今年这届 IMO 无比热闹，先是中国代表队六人全部获得金牌，以总分231分，列全球第一。然后，AI 也首次站上IMO金牌线：谷歌DeepMind宣布，其最新模型Gemini Deep Think取得35分，成功获得IMO官方认证的金牌成绩。

微软「AI for Science」团队推出BioEmu，将蛋白质研究速度提升10万倍！从结构到功能，从折叠到突变，这个开源神器正改变药物研发的未来。

在大模型推理阶段，能否让大模型摆脱单个 token 顺序预测的瓶颈，也和人类的逻辑一样，从更大层面考虑输出内容呢？

历史热榜