🔥51CTO热榜:2025-07-24

一项来自普林斯顿和伯克利的重磅研究揭露了AI的胡扯本质。从空洞修辞到误导性半真话,AI如何用花言巧语掩盖真相?快来看「胡扯指数」如何量化AI的忽悠能力!
根据用户在事后用 AI 辅助完成的技术分析,这场灾难的根源始于最初那个 mkdir 命令。在 Windows 中,如果目标文件夹已存在,mkdir 会返回错误。但 Gemini 似乎没有正确解析命令返回值,错误地将这次操作视为成功。
今年这届 IMO 无比热闹,先是中国代表队六人全部获得金牌,以总分231分,列全球第一。然后,AI 也首次站上IMO金牌线:谷歌DeepMind宣布,其最新模型Gemini Deep Think取得35分,成功获得IMO官方认证的金牌成绩。
微软「AI for Science」团队推出BioEmu,将蛋白质研究速度提升10万倍!从结构到功能,从折叠到突变,这个开源神器正改变药物研发的未来。
在大模型推理阶段,能否让大模型摆脱单个 token 顺序预测的瓶颈,也和人类的逻辑一样,从更大层面考虑输出内容呢?