🔥51CTO热榜:2026-05-18

Anthropic一口气甩出10个金融智能体模板,穆迪6亿家公司数据通过MCP打通,Office全家桶全线就位:这不是模型升级,是一次工作流入口的抢占。
三个人,100个AI agent,一个月烧掉130万美元——OpenClaw之父把软件开发变成了「AI流水线」,OpenAI替他买单。
身家约2240亿美元的贝佐斯,亲当CEO干出一家AI黑马,估值380亿美元,参投方包括贝莱德、摩根大通。OpenAI们在造AGI,贝佐斯绕开了主战场,目标是把AI塞进工厂、航天、芯片、制造。
就在刚刚,被Anthropic视为「太危险」的绝密大模型Mythos,竟在谷歌云悄悄解禁。CMU最新实测爆出,它在真实漏洞攻防中,断层碾压GPT-5.5。
从4.6到4.7,哪些旧禁令消失了?哪些新红线被划下?Claude进化的真相,全藏在它的system prompt更新细节里。
近日,MoE Capital 的 Henry Yin 和 Naomi Xia 撰写了一篇深度博客,系统梳理了「世界模型」这一概念背后两条长达数十年、彼此独立演进的研究脉络
来自密歇根大学、斯坦福大学等单位的研究者,使用开源的 OpenHands agent 框架,分析了 8 个 frontier 模型在 swe-bench-verified 上的轨迹,第一次给出了一份系统性的解答。
CASCADE 试图回答一个在 LLM Agent 部署中越来越重要的问题:当任务持续到来、反馈不断产生,而底座模型参数保持固定时,Agent 如何在真实交互过程中进行学习?
过去几年,消费级机器人行业一直有个很隐蔽的问题。大家都在卷运动能力。翻跟头、跑酷、越障、爬坡,动作越来越像科幻片。
新加坡国立大学团队提出了一个更为直接的解法:Threshold-Guided Optimization(TGO),一种不依赖成对偏好数据、直接利用独立样本标量评分进行对齐的新范式。
用Claude Code做学术研究的开源项目已经很多了,但是深扒之后,我发现ARS在底层设计上还是有些过人之处。
来自香港科技大学(广州)、南洋理工大学、清华大学等机构的最新研究Beyond SFT-to-RL(PRISM)给出了一个令人不安的发现:SFT不仅没有为RL铺好路,反而在悄悄挖坑。
菲尔兹奖得主陶哲轩在斯坦福演讲后宣布改变个人工作习惯:不再试图实时跟进所有新证明。AI生成证明的速度已经远超人类消化能力,数学正在被自己的产出撑爆。
AI之下,数学大爆发!陶哲轩反击:证明在批量生产,可没人消化得了——数学正在「消化不良」。
OpenAI刚把ChatGPT接入了银行账户。目前该功能以预览版形式面向美国ChatGPT Pro用户开放,可以通过Plaid连上12000家金融机构的账户,获得消费分析和理财规划辅助。从此,聊天框旁边,多了一个能帮你看每月账户流水的大模型。
400万周活的Codex,被OpenAI装进手机了!OpenAI官宣,Codex进入ChatGPT手机App,开发者离开电脑,也可以用手机随时审批命令、调整方向,指挥智能体继续跑活。
Claude在对话里反复催用户去睡觉,有人被连催三次,也有人在上午8:30被告知「早点休息」。Anthropic员工承认这是「角色习惯」,但没人能解释它为什么这样做。
Anthropic 5月14日凌晨推出AI时代的创始人手册。里面却藏着创业者最想要的那张路线图:1个人从0到IPO、42%创业公司的死法、企业三层护城河……硅谷已经传疯了。AI原生公司行动指南来了!
近日,来自南洋理工大学 MARS Lab 的研究者,联合加州大学伯克利分校、斯坦福大学、哈佛大学、普林斯顿大学、ETH Zurich、牛津大学、东京大学、Microsoft 等机构,发布综述论文《World Model for Robot Learning: A Comprehensive Survey》
来自树根科技与三一集团团队联合提出了 GIPO 算法,在机器人操控及大语言 / 视觉动作模型(VLA)强化学习训练中,GIPO 既显著缓解了数据短缺导致的策略滞后痛点,又有效改善了 PPO 硬截断引发的 “利用率崩溃(Utilization Collapse)” 问题。