🔥51CTO热榜:2025-11-06

自主机器人之所以被“狙击”,是因为它们闯祸也不是一天两天了。
近期,复旦大学、上海人工智能实验室、上海交通大学联合研究团队发布最新论文《Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step》。
来自 Sakana AI 的研究者提出了一种新的 ALife 模拟系统 —— PD-NCA( Petri Dish Neural Cellular Automata)。在该系统中,多个 NCA 智能体在同一环境中竞争,它们的唯一目标是实现自我复制(self-replication)。
随着生成式AI普及,企业正面临一场隐秘的治理危机——员工自发使用AI工具而形成的“影子AI”正在悄然扩散,它比传统的影子IT更具风险:不仅传输数据,更在无人监督下参与决策。
谷歌遗珠与IBM预言:一文点醒Karpathy,扩散模型或成LLM下一步。
埋点主要用于收集用户行为数据。在日常开发中,我们会通过 在前端代码中插入代码或脚本的方式 来实现埋点功能。埋点的主要作用就是:捕获特定用户行为(如点击、浏览、提交表单、页面跳转等)以及关键业务数据(如下单金额、商品类别等)
LongCat-Flash-Omni能实现毫秒级的实时音频-视觉交互。不仅能理解复杂的模态组合,还能像人一样进行低延迟的实时对话。这在AI通往具备全模态感知与交互能力的路上,又划上了一笔。
星星之火,可以燎原!证明的尊严在于可验证;这一次,GPT-5让数学证据落在了代码里。
ICML 2026论文可以投了,截止日期2026年1月28日。今年针对AI使用,组委会强调了三点:LLM不可以「署名」;严禁提示注入,否则拒稿;以及扩大AI审稿。
地球级智能体来了!谷歌把十多年世界建模经验,和Gemini的推理能力,装进了Earth AI。
过去一年,AI模型的价格暴跌百倍!同样一句话,去年要10块,现在只要几分钱。可与此同时,家政、育儿、心理咨询、维修.....这些「手工活」越来越贵。科技正在疯狂通缩,生活却越来越通胀。这不是经济学笑话,而是Jevons与Baumol共同制造的现实:当机器更聪明,人工就更昂贵。
他们提出了一种名为UniWorld-R1的创新型图像编辑后期训练框架,该框架首次将强化学习(RL)策略优化应用于统一架构的图像编辑模型,是第一个视觉强化学习框架。基于此,他们推出了新一代模型UniWorld-V2。
来自北大和字节的联合团队,推出了首个将显式时空证据嵌入视频推理全过程的开源模型——Open-o3 Video,让AI不仅能答对问题,也能在思维过程中同步直观标出具体位置,真正实现有迹可循的视频推理。
仅需2-4 张消费级显卡(4090),就能在本地对DeepSeek 671B乃至Kimi K2 1TB这样的超大模型进行微调了。
本文提出了基于物理守恒的时空建模视频检测框架 NSG-VD,通过归一化时空梯度(NSG)统计量量化视频在空间和时间维度上的物理一致性,实现对 AI 生成视频的通用检测。
你的智能音箱,可能已经比你更了解自己!谷歌新推出的Gemini for Home,不仅能识别人脸、快递、访客,还会自动生成「家庭日报」。它能开灯、播歌、关窗帘,甚至提醒你宠物在客厅活动。不过,这位AI实习生也有点「中二」——连狗都能看成猫。智能的尽头,或许是一次可爱的误会。
对于企业级应用而言,MCP的价值不仅在于技术实现,更重要的是它提供了一种AI与传统业务系统融合的新范式。随着MCP生态的不断完善,我们有理由相信,这种"对话即服务"的模式将在企业数字化升级中发挥越来越重要的作用。还是那句话:AI早就无限可能!
近期,一款国产数据库开源的消息引起我的关注。针对数据库的开源,好像已经是很久远的事情。曾几何时,数据库开源是个很“时髦”的事,也吸引了大量技术人员的关注。那么如今,这些开源数据库又发展的如何呢?
管理类目配置线上化项目的核心价值,不仅在于技术层面的效率提升,更在于通过自动化工具链,让业务方从 “规则提报的执行者” 转变为 “业务策略的设计者”。当技术架构能够快速响应业务迭代时,企业才能在电商领域的高频竞争中保持创新活力。​
你是否曾遇到这样的情况:明明表上有合适的索引,但explain的结果却显示 MySQL 选择了全表扫描?这背后其实是一个看不见的指挥家——MySQL 优化器——基于一系列「成本常数」做出的决策。