🔥51CTO热榜：2025-07-14

大神Karpathy提出了一种超越当前RL范式、更接近人类学习机制的新思路

为了教授模型复杂的工具使用能力，Kimi K2 开发了一个全面的管道，灵感来源于 ACEBench，能够大规模模拟真实世界的工具使用场景。

AI也能选择性失忆？Meta联合NYU发布新作，轻松操控缩放Transformer注意头，让大模型「忘掉狗会叫」。记忆可删、偏见可调、安全可破，掀开大模型「可编辑时代」，安全边界何去何从。

在5月中旬，谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题，或将开启了一场无需「灵感」的科学革命：未来，科学家将不再依赖直觉，而是靠AI解决难题！

这是一项最新登上Nature的突破性研究，来自德国的研究团队只用了5天训练时间就开发出人类认知的通用计算模型——Centaur。

发布72小时，Grok 4爆红硅谷！全网首测惊艳众人，2分钟即可部署一款游戏，一句话直出完整动画。今天，正好是xAI成立两周年，马斯克SpaceX将投20亿，据称未来要把模型送上火星。

在硅谷，顶尖AI人才的身价突破天际！最近，Meta豪掷数亿美元签下最顶尖的AI研究者。硅谷这场人才战争也越演越烈。这是否值得投资？这场人才争夺背后，又隐藏着怎样的深层次问题？

部分研究提出采用 Jacobi 解码替代传统的自回归解码，以期提升推理效率。然而，由于 Jacobi 解码往往需要较多迭代次数，其加速效果在实践中较为有限。

流体力学融入生成式 AI ，构建了一种非常简洁、优雅的形态。

近日，一家非营利性 AI 调研机构「METR」进行了一项随机对照实验，旨在了解 AI 编程工具如何加速经验丰富的开源开发者的工作效率。

谷歌曾被OpenAI甩在身后，27岁小哥却凭一己之力成为谷歌AI的「流量密码」。他用硬核技术和贴心互动，成了开发者心中的知心大哥。

最近，来自埃默里大学、佐治亚理工学院、耶鲁大学和德克萨斯大学西南医学中心的研究团队，发布了全球首个专注于医疗代码生成的大模型训练平台——MedAgentGym。

新玩法一出，很多人兴致勃勃地参与到了这场“穿越”里，甚至脑洞大开地尝试了很多新奇玩法。

这项研究涉及来自斯坦福大学、卡内基梅隆大学、明尼苏达大学和德克萨斯大学奥斯汀分校的研究人员。

本论文提出的 EasyCache，是一种无需训练、无需模型结构改动、无需离线统计的推理加速新框架。它的核心思想非常直接：在推理过程中，动态检测模型输出的「稳定期」，复用历史计算结果以减少冗余推理步骤。

Tokenization，一直是实现真正端到端语言模型的最后一个障碍。

今年大家多多少少都有接触到AI相关的项目了，从前端的角度来看以前是调用后端的接口，现在改成了调用大模型提供的接口，本质依然没变。

近期，北京大学与香港中文大学的研究团队联合发布了名为 Fast-in-Slow（FiS-VLA）的全新双系统视觉 - 语言 - 动作模型。

AI也要氛围阅读，Karpathy提出PDF论文已不适合AI时代，呼吁以Git、Markdown等结构化格式重塑科研写作。他认为未来99%的注意力将来自AI，科研成果应为AI优化。

本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程中，模型能够从所有先前的视图中提取有效的引导信息，从而增强多视图的一致性。

历史热榜