🔥51CTO热榜:2026-04-27

1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro文本IQ 130踩上门萨会员线,视觉IQ直接飙到145,杀进天才区。一年前「LLM过不了130」还是技术圈共识,今天,这堵墙彻底被砸碎!
2天搭建、不到1000美元、50个Codex并行扫描——OpenClaw创始人祭出ClawSweeper,一天关闭5000+无效Issue,GitHub API限流成唯一瓶颈,开源维护正式进入AI「自愈」时代。
Meta内部搞了个AI用量排行榜「Claudeonomics」,8.5万员工拼消耗、冲段位、抢「Token传奇」称号。有人一个月烧掉200万美元,有人写外挂冲榜,有人挂着Agent睡觉也在跑——硅谷卷Token,已经卷到走火入魔了。
它是一个专注于控制代码「洪流」的 AI 维护机器人,负责关闭 OpenClaw 上那些已经实现或明显没有意义的 issues 和 PR。当前,OpenClaw 积压了近 5 千个 issues 和 4 千多个 PRs。
斯坦福、伯克利与英伟达联合提出 Agent 验证框架 LLM-as-a-Verifier。该方法是一种通用的验证机制,可与任意 Agent Harness 和模型结合。
这是一个很微妙的时代。一边是大模型以令人眩晕的速度迭代,参数量从百亿冲向万亿;另一边是学术界的一片沉默 —— 我们依然没有找到深度学习的基本理论,神经网络仍然是个黑盒子。
哈尔滨工业大学(深圳)等机构的研究者提出了 ReBalance 方法,并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确:高效推理的关键并非盲目压缩推理长度,而是在过度思考与思考不足之间维持动态平衡。
从详细的更新界面可以看到,此次 OpenClaw 更加注重生产力集成和模型架构:不再只是简单的对话,而是深度嵌入你的工作流。
MathForge 真正回答了一个非常关键的问题:在强化学习里,哪些题最值得学?
来自上海交大的IPADS研究团队提出了SkVM:面向Skill的语言虚拟机。
Anthropic让69名员工把买卖大权交给Claude,结果发现强模型智能体在交易中能比弱模型多赚70%,Opus用户在谈笑间就完成了对Haiku用户的收割。哪怕你写出花一样的提示词教智能体砍价,在绝对的模型代差面前只有被降维打击的份。
马斯克将当庭起诉十年前的合伙人奥特曼。他不要钱,只要让OpenAI回到2015年。这场庭审,可能直接卡死OpenAI的IPO之路。
谷歌豪掷400亿美元加注Anthropic,自家Gemini正面对垒的「敌人」。当Claude年化收入一年暴涨30倍冲到300亿,当算力成为AI下半场唯一硬通货,与其用Gemini硬刚,不如把对手变成TPU最大买家。
4 月 20 日,OpenAI 发布了 Chronicle,带来了一个很关键的能力:AI 可以直接「看见你的屏幕」,并持续记住上下文。
翻完 DeepSeek V4 近 60 页的技术报告,我们发现这两个已开源万亿模型之间的默契,比任何单打独斗都可怕。
这篇综述最大的价值,不只是系统总结了前馈式 3D 场景建模的发展,更在于它提出了一个更具解释力的视角:相比按表示形式分类,围绕特征、几何、效率、增强和时序这些核心问题来理解方法演进,更能揭示这一领域真正的研究脉络。
他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
来自南京大学NJU-LINK实验室刘佳恒老师课题组、快手科技等机构的研究者提出了CodeTracer。
中外热搜上了一整圈,科技媒体的版面今天都让给了它,OpenAI也成了它的陪衬。
gpt-image-2 这次往前走的,主要是可用性。这比"又一个更强模型"更值得聊。模型跨过可用线之后,就能真正塞进业务系统里跑,而不只是设计师的新玩具。