🔥51CTO热榜:2025-07-14

大神Karpathy提出了一种超越当前RL范式、更接近人类学习机制的新思路
为了教授模型复杂的工具使用能力,Kimi K2 开发了一个全面的管道,灵感来源于 ACEBench,能够大规模模拟真实世界的工具使用场景。
AI也能选择性失忆?Meta联合NYU发布新作,轻松操控缩放Transformer注意头,让大模型「忘掉狗会叫」。记忆可删、偏见可调、安全可破,掀开大模型「可编辑时代」,安全边界何去何从。
在5月中旬,谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题,或将开启了一场无需「灵感」的科学革命:未来,科学家将不再依赖直觉,而是靠AI解决难题!
这是一项最新登上Nature的突破性研究,来自德国的研究团队只用了5天训练时间就开发出人类认知的通用计算模型——Centaur。
发布72小时,Grok 4爆红硅谷!全网首测惊艳众人,2分钟即可部署一款游戏,一句话直出完整动画。今天,正好是xAI成立两周年,马斯克SpaceX将投20亿,据称未来要把模型送上火星。
在硅谷,顶尖AI人才的身价突破天际!最近,Meta豪掷数亿美元签下最顶尖的AI研究者。硅谷这场人才战争也越演越烈。这是否值得投资?这场人才争夺背后,又隐藏着怎样的深层次问题?
部分研究提出采用 Jacobi 解码替代传统的自回归解码,以期提升推理效率。然而,由于 Jacobi 解码往往需要较多迭代次数,其加速效果在实践中较为有限。
流体力学融入生成式 AI ,构建了一种非常简洁、优雅的形态。
近日,一家非营利性 AI 调研机构「METR」进行了一项随机对照实验,旨在了解 AI 编程工具如何加速经验丰富的开源开发者的工作效率。
谷歌曾被OpenAI甩在身后,27岁小哥却凭一己之力成为谷歌AI的「流量密码」。他用硬核技术和贴心互动,成了开发者心中的知心大哥。
最近,来自埃默里大学、佐治亚理工学院、耶鲁大学和德克萨斯大学西南医学中心的研究团队,发布了全球首个专注于医疗代码生成的大模型训练平台——MedAgentGym。
新玩法一出,很多人兴致勃勃地参与到了这场“穿越”里,甚至脑洞大开地尝试了很多新奇玩法。
这项研究涉及来自斯坦福大学、卡内基梅隆大学、明尼苏达大学和德克萨斯大学奥斯汀分校的研究人员。
本论文提出的 EasyCache,是一种无需训练、无需模型结构改动、无需离线统计的推理加速新框架。它的核心思想非常直接:在推理过程中,动态检测模型输出的 「稳定期」,复用历史计算结果以减少冗余推理步骤。
Tokenization,一直是实现真正端到端语言模型的最后一个障碍。
今年大家多多少少都有接触到AI相关的项目了,从前端的角度来看以前是调用后端的接口,现在改成了调用大模型提供的接口,本质依然没变。
近期,北京大学与香港中文大学的研究团队联合发布了名为 Fast-in-Slow(FiS-VLA) 的全新双系统视觉 - 语言 - 动作模型。
AI也要氛围阅读,Karpathy提出PDF论文已不适合AI时代,呼吁以Git、Markdown等结构化格式重塑科研写作。他认为未来99%的注意力将来自AI,科研成果应为AI优化。
本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程中,模型能够从所有先前的视图中提取有效的引导信息,从而增强多视图的一致性。