🔥51CTO热榜:2025-10-13

国际奥赛又一块金牌,被AI夺下了!在国际天文与天体物理奥赛(IOAA)中,GPT-5和Gemini 2.5 Pro完胜人类选手,在理论和数据分析测试中,拿下了最高分。
扩散模型本该只是复制机器,却一次次画出「六指人像」甚至是陌生场景。最新研究发现,AI的「创造力」其实是架构里的副作用。有学者大胆推测人类的灵感或许也是如此。当灵感成了固定公式,人类和AI的差别还有多少?
在中国科学院计算技术研究所入选NeurIPS 2025的新论文中,提出了SpaceServe的突破性架构,首次将LLM推理中的P/D分离扩展至多模态场景,通过EPD三阶解耦与「空分复用」,系统性地解决了MLLM推理中的行头阻塞难题。
来自清华大学的研究团队在 NeurIPS 2025 发表文章,首次系统性地揭示了强化学习(RL)在提升 VLA 泛化能力上的独特优势,并带来了一套全面的评测基准和高效训练方法。
JADES 框架的提出,为越狱评估领域建立了一个透明、可靠且可审计的新标准。它不仅是一个性能更优的工具,更重要的是,它通过严谨的实证研究揭示了当前领域内存在的系统性偏差。
这是一个实验性的 30B 参数稀疏 MoE 模型,其中有 3B 激活参数,由一个预训练的 AR 模型(Qwen3-30BA3B)转换而来,并在持续预训练中累积训练 500B 个 token,以实现完整的扩散行为。作者同步开源了模型、训练配方、推理代码以及样例输出。
当前「AI 威胁就业」的论调,更多是基于技术趋势的预警,而非基于现实的既成事实,但这也绝非轻视 AI 长期影响的理由。
一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 ​​Agentic Context Engineering​(智能体 / 主动式上下文工程)的技术,让语言模型无需微调也能实现自我提升!
清华特奖选手创办的Sand.ai,上线了音画同步视频模型GAGA-1。
OpenAI前CTO Mira Murati创业公司Thinking Machines Lab证实,联创、首席架构师Andrew Tulloch已经离职去了Meta。
Go 的设计哲学之一是简洁性和明确性。Go 没有类(class)这个概念,取而代之的是通过**结构体(struct)**来定义数据类型,而方法则通过与结构体类型关联来扩展其行为。
清华大学与生数科技(Shengshu AI)团队围绕桥类生成模型与音频超分任务展开系统研究,先后在语音领域顶级会议ICASSP 2025和机器学习顶级会议NeurIPS 2025发表了两项连续成果。
在新课中,吴恩达将Agentic工作流的开发沉淀为四大核心设计模式:反思、工具、规划与协作,并首次强调评估与误差分析才是智能体开发的决定性能力。
抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2。
在深入 GPU 集成之前,清晰理解 Java 开发者常用的不同执行模型至关重要。这些概念常被交叉使用,但彼此含义不同。理解边界能帮助你把握 CUDA 加速真正闪光之处。
本篇介绍了AES加密的原理,通过一个具体的字符串和自定义密钥,演示了AES加密的全过程,包括密钥的扩展过程,每轮加密的数据变换过程等,最终得到加密的结果。
随着模型规模的持续增大,成本上涨、效率衰减与能耗激增的问题也越来越凸显。在此背景下,模型蒸馏(Model Distillation)这一技术路径,正为应对这些挑战提供了一条巧妙的解决思路。
许多优化方法过分追求简短的指令,比如只告诉大模型"创建单元测试以确保方法按预期运行"。这听起来清晰明了,但实际上丢失了大量领域特定的技巧、工具使用指南和常见错误模式。
openId​​是用户在这个小程序的唯一标识,​​unionId​​是微信是你在微信开发平台的唯一标识,就是多个小程序中你的​​unionId​​都是一样的。 前端​​wx.login​​获取临时登录code,传给后端,后端用来换取​​openId​​。
字节跳动最近内部发布政策,对于因为组织调整而离开的正式员工,新增发放过渡性补贴,每月最高可领1.2万元,最多可领6个月。这话题在脉脉上直接爆了!