🔥爱范热榜:2025-07-26

7 月 25 日,清华大学与生数科技联合研发的 Vidar 模型,首次让通用视频大模型长出了「手脚」,通过少样本泛化能力,实现从虚拟的 Dream World 到真实世界 Real World 物理执行的关键跨越。 官方表示,这项创新不仅打破了传统具身智能的数据桎梏,更开创了「虚实互通」的全新范式,有望真正实现具身智能的 scaling law。 据悉,Vidar 是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身基座模型。该模型创新性地构建了支持机器人双臂协同任务的多视角视频预测框架,在保持 SOTA 性能的同时,展现出显著的少样本学习优势。 为让模型更「见多识广」,实现多类型机器人操作的深度融合,灵活适应各种物理环境,清华大学和生数团队创新性地提出了基于统一观测空间的具身预训练方法。这套方法巧妙运用统一观测空间、海量具身数据预训练和少量目标机器人微调,实现了视频意义上的精准控制。 在视频生成基准 VBench 上的测试表明,经过具身数据预训练,Vidu 模型在主体一致性、背景一致性和图像质量这三个维度上都有了显著的提升,为少样本泛化提供了有力支撑。 具体表现上,在 16 种常见的机器人操作任务上,Vidar 取得了远超基线方法的成功率;再细分到类别,Vidar 在没见过的任务和背景上的泛化能力尤为突出。 目前,试验项目与论文均已上线。 论文链接:https://arxiv.org/abs/2507.12898,https://arxiv.org/abs/2507.12768 项目链接:https://embodiedfoundation.github.io/vidar_anypos
AI 教父 Hinton 中国首次演讲:人类可能就是大语言模型|#WAIC2025# WAIC 首日,便以重磅嘉宾开场——诺贝尔奖得主,人工智能教父 Geoffrey Hinton,发表了开幕演讲。紧随其后的是 MiniMax 创始人、首席执行官闫俊杰的主题演讲「每个人的人工智能」。后续则是一系列的专家圆桌对谈。 作为最为关注 A ……
今年是爱范儿第四年参与 FIRST 电影节超短片单元,也是 vivo 赞助 FIRST 青年电影展的第六个年头。随着手机影像素质的跃升,今年获奖的作品完成度和成熟度都更高了,至少在术的层面,已经很少再有人去讨论手机「够不够用」的问题。 当「术」正在成为超短片中最不重要的部分,创作者们正在尝试回答一个 ……
阿里首款自研AI眼镜亮相!夸克AI加持,淘宝支付宝都能用|#WAIC2025# 7 月 26 日,2025 世界人工智能大会(WAIC)首日,此前处于严格保密状态的「夸克 AI 眼镜」首度以完整形态亮相,并公开其技术研发进展。这标志着阿里巴巴 AI 战略从软件延伸至穿戴硬件,迈出关键一步。 http://t.cn/A6F2fexQ ……