🔥51CTO热榜:2025-09-15

来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现:在心算任务中,几乎所有实际的数学计算都集中在序列的最后一个token上完成,而不是分散在所有token中。
表面上,AI正在狂飙突进;但背后,却是一群「看不见的人」在默默撑起这场科技竞赛。马斯克的xAI大规模裁员转型专家标注,谷歌外包工人被迫处理负面暴力内容。AI是靠无数普通人的劳动堆出来的。
苹果AI再传震荡:前Siri负责人、AKI高级总监Robby Walker即将离任。如今,苹果在AI领域的落地已严重失速,备受期待的新版Siri功能也被推迟至2026年。
超高规格团队,重新审视RL推理领域发展策略。来自清华大学和上海人工智能实验室等的研究者们组织并总结了推理模型的最新 RL 研究,形成了一份非常全面的调查综述,回顾最新进展,讨论面临的问题,并展望未来的发展方向。
这是 MobileLLM 的全新高效推理模型系列,包含两类模型:基础模型 MobileLLM-R1-140M-base、MobileLLM-R1-360M-base、MobileLLM-R1-950M-base 和它们相应的最终模型版。
上海交通大学与字节跳动研究团队联手推出的RhymeRL,从一个被忽视的现象入手,巧妙地将历史数据变废为宝,在不牺牲精度的前提下,将RL训练吞吐量提升了2.6倍。
快手可灵团队(Kling Team) 提出了一种名为 MIDAS(Multimodal Interactive Digital-human Synthesis)的新型框架,通过自回归视频生成结合轻量化扩散去噪头,实现了多模态条件下实时、流畅的数字人视频合成。
西湖大学自然语言处理实验室推出了首个AI生成学术成果的开放预印本平台AiraXiv,以及首个模拟人类专家思考链的AI审稿人系统DeepReview。
在这篇文章中,Anthropic 介绍了一些在多种 agentic AI 系统中被证明最有效的性能提升技巧。
谷歌DeepMind、LIGO(激光干涉仪引力波探测器)团队和GSSI(格兰萨索科学研究所)合作开发的Deep Loop Shaping技术,将引力波探测的低频降噪能力拉到了新高度。
攻击者正利用生成式AI将恶意提示嵌入文档宏、VBA脚本及文件元数据,通过提示注入误导AI系统、泄露敏感数据或获取后端访问权限。
本文将深入剖析 Sort-Based Shuffle 的核心原理、Shuffle Manager 的可插拔设计,以及 Map-side 聚合、Partition Reuse、堆外 Shuffle 等关键优化技术,并结合源码揭示其实现细节。
还真有!今天咱就聊个 “极简派” 方案 ——Sa-Token + Gateway + Nacos,不用复杂配置,不用绕弯子,5 步搞定全链路鉴权,看完你绝对会说:“早知道这玩意儿,谁还折腾 Spring Security 啊!”
经过这些年的实践,我发现解决数据倾斜问题的关键,不在于掌握多少技术技巧,而在于建立正确的思维模式。真正的高手,会把数据倾斜看作一个系统性问题。他们不会孤立地看待技术指标,而是会从业务、技术、运营三个维度综合考虑。
通过构建多层级的文本语义树,同时保留高层主题框架与低层细节信息,在NarrativeQA、QASPER等多个权威数据集上刷新SOTA,为长文本检索提供了全新范式。
芯片再快,也快不过光!微软研究院在剑桥拼出了一台模拟光学计算机:用手机摄像头、Micro LED和透镜拼成,却在实验里跑出了速度快100倍、能效高100倍的潜力。这一成果如今登上Nature,或许,算力格局将被改写。
诺奖得主哈萨比斯直击AI痛点:当前LLM远非博士级智能,仅在特定领域闪光,却缺乏全面性和一致性。真正的AGI,还需1-2项关键突破,等待有5-10年。
无需昂贵集群,不惧硬件异构。Gensyn AI团队的SAPO算法,让全球分散的消费级设备组成“蜂群”,通过共享解题经验,实现小模型能力的集体跃迁,为AI民主化开辟新路径。
这份报告的内容非常全面,无论是技术新手或老手都能深度了解关于智能体的相关内容。在基础理论部分,清晰阐述基础概念,深入剖析大模型、RAG与智能体的区别和关系,帮助开发者构建扎实认知根基。
来自斯坦福大学、华盛顿大学等机构的研究者探索了一种截然不同的方式:在未解决的问题上评估模型的能力。