🔥51CTO热榜：2026-04-27

1946年至今，「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分，GPT-5.5 Pro文本IQ 130踩上门萨会员线，视觉IQ直接飙到145，杀进天才区。一年前「LLM过不了130」还是技术圈共识，今天，这堵墙彻底被砸碎！

2天搭建、不到1000美元、50个Codex并行扫描——OpenClaw创始人祭出ClawSweeper，一天关闭5000+无效Issue，GitHub API限流成唯一瓶颈，开源维护正式进入AI「自愈」时代。

Meta内部搞了个AI用量排行榜「Claudeonomics」，8.5万员工拼消耗、冲段位、抢「Token传奇」称号。有人一个月烧掉200万美元，有人写外挂冲榜，有人挂着Agent睡觉也在跑——硅谷卷Token，已经卷到走火入魔了。

它是一个专注于控制代码「洪流」的 AI 维护机器人，负责关闭 OpenClaw 上那些已经实现或明显没有意义的 issues 和 PR。当前，OpenClaw 积压了近 5 千个 issues 和 4 千多个 PRs。

斯坦福、伯克利与英伟达联合提出 Agent 验证框架 LLM-as-a-Verifier。该方法是一种通用的验证机制，可与任意 Agent Harness 和模型结合。

这是一个很微妙的时代。一边是大模型以令人眩晕的速度迭代，参数量从百亿冲向万亿；另一边是学术界的一片沉默 —— 我们依然没有找到深度学习的基本理论，神经网络仍然是个黑盒子。

哈尔滨工业大学（深圳）等机构的研究者提出了 ReBalance 方法，并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确：高效推理的关键并非盲目压缩推理长度，而是在过度思考与思考不足之间维持动态平衡。

从详细的更新界面可以看到，此次 OpenClaw 更加注重生产力集成和模型架构：不再只是简单的对话，而是深度嵌入你的工作流。

MathForge 真正回答了一个非常关键的问题：在强化学习里，哪些题最值得学？

来自上海交大的IPADS研究团队提出了SkVM：面向Skill的语言虚拟机。

Anthropic让69名员工把买卖大权交给Claude，结果发现强模型智能体在交易中能比弱模型多赚70%，Opus用户在谈笑间就完成了对Haiku用户的收割。哪怕你写出花一样的提示词教智能体砍价，在绝对的模型代差面前只有被降维打击的份。

马斯克将当庭起诉十年前的合伙人奥特曼。他不要钱，只要让OpenAI回到2015年。这场庭审，可能直接卡死OpenAI的IPO之路。

谷歌豪掷400亿美元加注Anthropic，自家Gemini正面对垒的「敌人」。当Claude年化收入一年暴涨30倍冲到300亿，当算力成为AI下半场唯一硬通货，与其用Gemini硬刚，不如把对手变成TPU最大买家。

4 月 20 日，OpenAI 发布了 Chronicle，带来了一个很关键的能力：AI 可以直接「看见你的屏幕」，并持续记住上下文。

翻完 DeepSeek V4 近 60 页的技术报告，我们发现这两个已开源万亿模型之间的默契，比任何单打独斗都可怕。

这篇综述最大的价值，不只是系统总结了前馈式 3D 场景建模的发展，更在于它提出了一个更具解释力的视角：相比按表示形式分类，围绕特征、几何、效率、增强和时序这些核心问题来理解方法演进，更能揭示这一领域真正的研究脉络。

他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术，能够利用全球各地的异构硬件进行训练，并且即使当硬件发生故障时，系统也不会停止运行！

来自南京大学NJU-LINK实验室刘佳恒老师课题组、快手科技等机构的研究者提出了CodeTracer。

中外热搜上了一整圈，科技媒体的版面今天都让给了它，OpenAI也成了它的陪衬。

gpt-image-2 这次往前走的，主要是可用性。这比"又一个更强模型"更值得聊。模型跨过可用线之后，就能真正塞进业务系统里跑，而不只是设计师的新玩具。

历史热榜