🔥51CTO热榜:2026-05-15

当AI智能体开始拥有“生产环境写权限”,企业真正的风险已不再是技术能力,而是失控后的责任与恢复机制。Replit AI误删生产数据库事件,暴露出一个残酷现实:很多企业已经把“整栋大楼的钥匙”交给AI,却没有明确谁负责、如何叫停、如何回滚。
据腾讯云消息,腾讯云正式开源 TencentDB Agent Memory,面向 Agent 长任务场景提供短期记忆压缩与长期个性化记忆能力。据介绍,长期记忆已于上月上线免费使用,这次开源的重点是短期记忆压缩。
大模型负责“想”,Harness 负责“做”。大模型输出文本和工具调用指令,Harness 工具负责解析这些指令、执行工具、把结果喂回去给大模型继续想。
weak.Pointer​​ 和 ​​runtime.AddCleanup​​ 填补了 Go 运行时层两个长期缺失的能力:不延长对象生命周期的引用,和不引发对象复活的清理回调。它们组合使用可以构建出内存安全的规范化映射和自动清理缓存,这在之前需要靠 hack runtime 或接受内存泄漏。
作为火山引擎消息中间件产品矩阵之一的RocketMQ,目前结合社区已有方案完成了 AI 原生能力升级,推出了 RocketMQ For AI 解决方案。该方案以轻量化通信、智能化调度、企业级可靠性为核心,凭借 LiteTopic、优先级消息核心能力,精准解决大模型场景的核心难题.....
前端、后端、独立数据库、用户账号体系……全套齐备。你可以直接把链接甩给朋友,他注册后存入的数据,会稳稳地停留在你这套系统的独立数据库里。比起v0或Lovable这些AI建站工具,Kimi实际上接管了用户从开发到托管、再到数据库运维的全生命周期。
LinkedIn首席经济机遇官Aneesh Raman惊人言论:AI时代,做个真正的人,别再模仿机器,没人能打败你。
今年最有可能的技术突破点在于长程任务(Long-horizon tasks)。
Google DeepMind发布实验原型「AI-enabled pointer」,键盘、鼠标、触屏之后,下一代交互正在成形。
Anthropic 将 Agent SDK 用量从订阅中剥离,按 API 零售价另给固定额度。重度用户的可用量缩水近十倍。同一周,OpenAI 向企业用户推出 Codex 两个月免费迁移。ASI 决赛圈的第一场定价战,开打了。
一张普通的24G家用显卡,竟然能让一个32B的超大模型一口气读完6份长文档、自动写出周报?英伟达、MIT、浙大华人研究者联合出新招,让内存消耗直接暴降10倍,不降智也不爆显存,彻底击穿硬件天花板。
在做演示这件事上,工具确实不是最重要的——内容好、逻辑清才是根本。但一份视觉上明显高出平均水准的演示文稿,会让你在汇报前就多了三分信心,也让对方在你开口之前就觉得「这个人做事认真」。
Fiona 在演讲结尾给了一个作业,找一个你自己最不想开的会,或者最不想写的报告,问自己两件事,它还在完成它原本的目的吗?如果没有,能 Claudify,还是直接砍掉?
OpenAI 宣布 Codex 手机版在 ChatGPT App 中上线,安卓和 iOS 版都已开启 preview,面向包括免费版的所有用户。
来自中山大学和美团的研究团队提出了 X2SAM,一个统一的图像与视频分割多模态大模型框架。
本篇 Survey 从首创的 DVD 视角出发,系统地梳理了大模型训练数据价值密度增强领域的完整路线图。这一领域的研究有助于解决当下 LLM 训练数据枯竭与算力开销大等问题。
来自香港大学的研究团队提出了 FASTER,首次系统性地重新审视了动作分块策略中的反应延迟问题,并提出了一种面向流匹配 VLA 模型的快速动作采样方法。
三台同型号机器人(Gary、Bob、Frank)在零人工干预的情况下,进行完全自主的轮班制流水线工作。
研究团队提出了DYPO(Dynamic Policy Optimization) 动态策略优化方法。
Anthropic、Google、OpenAI,还有国内一票厂商,终于开始推两套协议:MCP和A2A。有人说这是AI Agent的"TCP/IP时刻"。今天我们就来好好聊聊,这个时刻到底是怎么回事。