🔥热词:模型

4 月 27 日,蚂蚁集团旗下全模态 AI 助手灵光 App 上线「体验世界模型」功能。用户上传一张图片,即可在手机端生成一个 60s 的 3D 世界,以第一人称视角进入其中,像玩游戏一样在 AI 实时生成的场景中漫游。无需本地部署,无需复杂配置,打开 App 即可体验。这是世界模型首次以移动端产品的形态,面向普通用户开放。 支撑这一体验的核心,是蚂蚁灵波科技开源的世界模型 LingBot-World-Fast。该模型在 480P 分辨率下可实现 16 fps 实时生成,端到端交互延迟控制在 1 秒以内,兼具通用性、长时序一致性与⾼动态场景表现能力。 除了面向普通用户的灵光 App 体验,开发者与研究者也可以基于开源的 LingBot-World-Fast 进行本地部署和二次开发。本地环境下,模型支持无缝的持续生成,用户可以通过键盘、鼠标实时操控视角与移动,也可以通过文本提示(Prompt)随时改变环境状态或触发局部事件,比如调整天气、切换画面风格等。 为了实现实时交互,蚂蚁灵波 LingBot-World-Fast 提出了专门的后训练优化方案,模型在生成过程中只聚焦新增画面内容,不再重复计算已稳定的部分,从而显著提升实时生成效率,同时尽可能确保画面质量、时序连贯性与场景一致性。 实时世界模型提供了一个可以进入、操作和即时响应的环境,每一次交互都能即时看到结果,而非等待离线渲染。对于具身智能研发而言,LingBot-World-Fast 可提供多样化的虚拟训练环境,帮助机器人在数字世界中进行场景理解、动作学习和任务演练。对于游戏开发和内容创作而言,它有望降低交互式内容原型制作门槛,提升从创意到体验的转化效率。 今年 1 月,蚂蚁灵波曾开源 LingBot-World-Base 版本,凭借高保真画质、10 分钟超长视频生成和出色的物理一致性,在世界模型方向上引发广泛关注。 目前,LingBot-World-Fast 模型与代码已在 Hugging Face 和 Model Scope 面向社区完整开放。普通用户可通过灵光 App 直接体验相关能力,开发者和研究者也可基于开源模型进行本地部署与进一步探索。
一张照片,一部手机,你就能在 AI 造的世界里漫步。 4 月 27 日,蚂蚁灵光 App 正式上线「体验世界模型 」功能,成为业界首个可在移动端体验世界模型的 AGI 产品。用户只需上传一张图片,即可在手机上最长 60 秒探索 3D 世界,并且用手游操控视角,像玩游戏一样在里面走动探索,从触发指令到开始探索,仅需秒级。 这是业内首次实现在端侧跑起世界模型,分钟级的长时一致性、实时可交互的体验再一次引领了 AGI 产品。灵光一直致力于探索智能的边界,在此之前灵光上线「闪应用」功能,率先实现在手机端 30 秒生应用引领全民 Wish Coding。 世界模型被视为通向 AGI(通用人工智能)的重要路径之一,是连接数字世界与物理世界的重要桥梁。此次灵光 App「体验世界模型 」功能背后接入了蚂蚁灵波 LingBot-World-Fast 世界模型,该模型也已经开源。 灵光 App 为用户提供了便捷的世界模型体验入口。打开灵光 App,在对话框上传一张图片后,系统会智能推荐操作指令,用户选择「生成图中世界」。或者,直接输入「帮我用第一人称视角探索这个世界」这类自然语言,系统会自动进入世界模型生成流程。从触发指令到开始探索,仅需秒级。 进入世界模型体验页面后,灵光 App 针对移动端用户的操作习惯进行了精心设计,创新性地引入了手游摇杆操控方式,让用户以最熟悉的方式探索 AI 即时生成的 3D 世界。具体而言,屏幕左侧摇杆负责控制角色在 3D 场景中的位移,用户可前后左右自由行走;右侧摇杆则负责控制视角旋转,实现全方位环顾探索。这一操控逻辑与主流 3D 手游高度一致,玩家无需额外学习,即可上手操控,真正做到「零门槛沉浸」。 世界模型的移动端部署,是行业里公认的难题。算力需求大、延迟控制难、终端性能参差不齐,每一条都是实际的工程挑战。灵光团队采用高效、低延迟的流式传输技术,实现了百毫秒级的响应延迟,用户从触发指令到开始探索 3D 世界仅需秒级,打破了此前世界模型「高门槛、高算力、难落地」的刻板印象。 灵光 App 负责人蔡伟表示,「体验世界模型功能是灵光在探索智能边界的又一实践。此前灵光推出的」闪应用「功能可实现自然语言 30 秒生应用,也是把原本专业开发者的 Coding 能力给到普通用户。灵光希望不断探索智能的边界,挖掘用户未被满足的需求,把好的 AI 体验给到所有人。」 目前,用户可在各大应用商店下载灵光 App,直接体验世界模型功能。
从顺行性遗忘症看 LLM 的上下文机制。
AI时代下,To B产品经理的生存法则正在被彻底改写。面对技术术语满天飞的产研会议与锱铢必较的客户质问,传统原型设计能力已不再是护城河。本文通过6个真实踩坑案例,揭秘如何用商业算账模型重构产品价值、用三层拆解法夺回PRD话语权、用合规底线思维设计AI边界,以及如何用极简MVP刺穿客户最痛的业务场景。
2026年4月,全球AI行业涌入了一个密度惊人的信息洪峰。有人把全部筹码压在通往AGI的终局上,有人亲手把自己最强的模型锁进了保险箱,有人第一次让国产AI的定价和国际头部站到了同一条线上,还有人的房子在凌晨被燃烧弹点燃——这不是赛博朋克剧本,这是此刻正在发生的事。
AI功能的未来或许不在于震撼的模型能力,而在于如何无缝融入用户日常操作。端侧小模型让AI不再是一个需要专门打开的独立功能,而是化身为输入法改写、拍照识别、离线翻译等高频场景中的隐形助手。这种从‘专门使用’到‘顺手发生’的转变,正在重新定义AI产品的核心价值与竞争维度。
AI浪潮席卷之下,产品经理们纷纷在简历加上“AI”标签,但热潮退去后,真正的能力沉淀成为关键。本文剥开AI外衣,直击产品经理的核心能力——从需求洞察到冲突调停,从实务处理到商业判断,揭示在技术迭代飞快的时代,如何守住“解决真实问题”的底线,找到属于自己的职场斩杀线。
AI 产品经理的战场正从技术应用转向价值交付。本文深度拆解 2026 年 AI 产品经理必备的 7 大核心能力模型,从需求判断到评测体系,从上下文设计到 Agent 编排,揭示如何将业务问题、系统能力与模型效能转化为可落地的商业结果。不是每个会调模型的人都能成为合格的 AI 产品经理,真正的分水岭在于能否构建完整的价值交付闭环。
“大家好,我是阿境,人称产品界的吴彦祖,一个沉稳又不沉闷的男人。” 先问个问题 “作为一名产品经理,你真的懂得沟通吗?” 诶,先别急着回答,看完文章,再重新思考下这个问题。 产品经理在日常工作当中, 不夸张地说,沟通几乎是占据了40%的工作内容 ,与运营沟通,与开发沟通,与用户沟通,与领导沟通等。 学会如何更高效率地沟通,能够使事情事半功倍,也能够有效地推动产品项目的运转。 同时,我
为了让草稿模型跑得更快、预测更准,谷歌做了几项架构层面的优化。
ChatGPT的默认模型正式升级为GPT-5.5 Instant,面向所有用户开放。
PromptEcho 揭示了一个简洁而深刻的洞察:VLM 的预训练损失函数本身就是一个高质量的文图对齐 reward 信号。
Anthropic让AI开口「招供」了。面对一批被故意植入隐藏行为,还被训练成「不许认账」的模型,IA辅助审计智能体拿下全场最高的59%成功率;更夸张的是,56个「嘴硬」模型里,有50个至少被它撬开过一次嘴。AI安全审计的游戏规则,悄悄变了。
中国科学院团队推出类脑大模型「瞬悉2.0」,通过优化架构与编码路径,显著提升了长序列处理效率与低功耗部署能力。该模型在保持高性能的同时,大幅降低训练与推理成本,为人工智能轻量化与多模态应用开辟新方向。
手语翻译不应只被看成视频到文本的映射问题,而应被视作跨模态推理问题。围绕这一判断,SignThought 给出了一个相对完整的答案。
ChatGPT默认模型,今天大升级。新版本GPT-5.5 Instant, 结合了5.5的基础智力 + 极速回复。免费用户也能用。
来自伊利诺伊大学香槟分校、清华大学、约翰霍普金斯大学以及哥伦比亚大学的研究人员在反复试验后,却得出来一个与我们的直觉有点相反的结论:大多数当下智能体并不能稳定、有效地把世界模型当作前瞻工具。
能重构10万行代码的顶尖模型,却会建议你走路去洗车店洗车?最近,Karpathy把这件怪事讲透了:AI能力是锯齿状的,背后是一门经济学。
北京大学DCAI课题组联合快手可灵团队、上海算法创新研究院、中关村学院等研究人员,推出了OpenWorldLib——一个统一、规范、可扩展的先进世界模型推理框架。
一篇来自香港大学和 Grace Investment Machine(GIM)的工作想把这件事换个做法。