首页
热榜
诗歌
博客
美图
分享
好物
牛股
友站
互动
登录
注册
🔥51CTO热榜:2025-09-28
10:13
51CTO
刚刚,北大&360里程碑式突破!32B安全分碾压千亿巨兽
打破思维惯性,「小模型」也能安全又强大!北大-360联合实验室发布TinyR1-32B模型,以仅20k数据的微调,实现了安全性能的里程碑式突破,并兼顾出色的推理与通用能力。
10:13
51CTO
苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
蛋白质折叠是计算生物学的皇冠难题,SimpleFold作为首个仅基于通用Transformer模块的蛋白折叠模型,摒弃了AlphaFold2系列的传统架构,能够直接将蛋白质序列生成完整的三维原子结构,在CAMEO、CASP基准测试上表现强劲。
10:13
51CTO
估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
在大模型训练时,如何管理权重、避免数值爆炸与丢失?Thinking Machines Lab 的新研究「模块流形」提出了一种新范式,它将传统「救火式」的数值修正,转变为「预防式」的约束优化,为更好地训练大模型提供了全新思路。
10:13
51CTO
免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
杜克大学团队发现,扩散大语言模型只需关注少量「中奖」token,就能在推理时把速度提升61-97倍,还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息,实现「少算多准」的双赢。
10:13
51CTO
刚刚,奥特曼预言:人类「只剩」最后5年!
奥特曼投下震撼弹:五年后AI将全面超越人类,到2030年诞生的「超级智能」甚至能攻克「量子引力」难题。人类智力的霸权时代,已进入倒计时。
10:13
51CTO
创智&交大发现AI能动性新规律, 78样本胜GPT5实现软件+科研自动化
AI 能动性的时代要求系统不仅能思考,更要能干活:包括协同编程(人机协作开发)和自动化科学研究。LIMI 仅用 78 个样本就超越 GPT-5 达 14.1%,并发现了能动性效率原则: AI 能动性不仅来源于数据丰富性,更来自于战略性构建。
10:13
51CTO
OpenAI研究大模型对GDP贡献,三大行业已能代替人类,并自曝不敌Claude
最近,OpenAI 又推出了一种名为 GDPval 的新评估方法,用来跟踪模型在具有经济价值的现实世界任务上的表现。
10:13
51CTO
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA
ACL 2025最新研究提出Lexical Diversity-aware RAG (DRAG) 框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。
10:13
51CTO
大模型“精细化”对齐,真实性提升25.8%刷新SOTA!token级精准编辑,无需训练即插即用
近年来,对大语言模型(LLMs)的内部激活值直接进行编辑,被证明是一种有效的推理时对齐方法,能够高效抑制模型生成错误或有害内容等不良行为,从而确保大语言模型应用的安全性与可靠性。
10:13
51CTO
从探索到验证:Parallel-R1 如何塑造大模型的"思考"哲学
Parallel-R1首次通过强化学习让大语言模型从零开始学会"并行思考",突破了传统监督微调的局限。本文介绍了其"三步走"战略,揭示模型如何从"计算探索者"进化为"多视角验证者",并发现并行思考可作为训练中的"探索支架"。这一发现不仅提升数学推理性能,更为理解AI"思考"机制打开新窗口。
10:13
51CTO
强化学习之父Richard Sutton最新采访:LLM是“死路一条”
图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。
10:13
51CTO
数据中心空调系统的隐形杀手:为什么90%的运维团队都在做无用功?
超过60%的数据中心存在制冷系统与IT负载不匹配的问题,这直接导致了15-25%的能源浪费。更让人震惊的是,在我接触的项目中,很多运维人员甚至不知道如何准确计算空调送风量与IT负载的匹配关系。
10:13
51CTO
Agentic AI 的 17 种模式及其在下一代大规模 AI 系统中的价值
当你构建一个大规模AI系统时,你其实是在把不同的代理设计模式组合起来。每个模式都有自己的阶段、构建方法、输出和评估。如果我们退一步,把这些模式归类,它们可以分成17种高层架构,这些架构捕捉了代理系统可能采用的主要形式……
10:13
51CTO
大模型评估全攻略:挑战、实战经验和最佳实践
评估 LLM 绝不是一个“一劳永逸”的任务。随着你的模型和用户群不断演变,你的评估策略也需要与时俱进。通过将离线基准测试与实时洞察相结合,利用追踪机制,并对新技术保持开放态度,你将在构建更可靠、更有影响力的 LLM 应用的道路上走得更远。
10:13
51CTO
RAG的Embedding模型选取大有门道
为你的 RAG 应用选对 embedding 模型不是只挑基准上最高分的那个。像 MTEB 的工具有帮助,但它们不能告诉你一切。重要是看数字之外,考虑对你项目真重要的,像语言支持、专业词汇、内存限,和文本长度。
10:13
51CTO
告别“视而不见”:CARE框架让大模型真正读懂上下文
当LLM对上下文证据“选择性失明”,RAG也无能为力?来自蒙特利尔大学与MetaGPT团队的CARE框架,开创“原生检索增强推理”新范式,让模型在思考中自主引用证据,无需外挂数据库,从根本上提升上下文保真度。
10:45
51CTO
无标签进化:EVOL-RL用“多数选择+新颖变异”破解大模型“熵坍缩”困局
当AI因“内卷”而丧失创造力,腾讯AI Lab的EVOL-RL框架带来了破局之钥。它不依赖标签,而是用“选择+变异”的进化法则,让大模型在无监督学习中实现真正意义上的持续“演化”,而非狭隘“适应”。
11:45
51CTO
IEEE TPAMI 2025 | 北京大学提出分布驱动的终身学习范式,用结构建模解决灾难性遗忘
研究者提出了更具现实意义的任务设定,终身行人重识别(Lifelong Person Re-ID, LReID)。该任务要求模型在持续接收新域数据的过程中,能够高效地增量学习新知识,同时保持对先前已学习域中身份信息的辨识能力,从而实现跨时间与跨域的长期学习与知识保留。
15:51
51CTO
DeepMind率先提出CoF:视频模型有自己的思维链
逐帧视频生成类似于语言模型中的链式思维。就像链式思维(CoT)使语言模型能够用符号进行推理一样,“帧链”(CoF)使视频模型能够在时间和空间上进行推理。
15:51
51CTO
OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤
OpenAI被曝在用户不知情下,强制将GPT-4、GPT-5等模型路由至两款低算力敏感模型「gpt-5-chat-safety」与「gpt-5-a-t-mini」,导致回复被过滤或替换,引发用户对选择权和付费权益的质疑。该现象已在社交媒体广泛验证。
<
1
2
3
4
>
历史热榜
51CTO 2025-09-27
51CTO 2025-09-26
51CTO 2025-09-25
51CTO 2025-09-24
51CTO 2025-09-23
51CTO 2025-09-22
51CTO 2025-09-21
51CTO 2025-09-20
51CTO 2025-09-19
51CTO 2025-09-18
51CTO 2025-09-17
51CTO 2025-09-16
51CTO 2025-09-15
51CTO 2025-09-14
51CTO 2025-09-13
51CTO 2025-09-12
51CTO 2025-09-11
51CTO 2025-09-10
51CTO 2025-09-09
51CTO 2025-09-08
51CTO 2025-09-07
51CTO 2025-09-06
51CTO 2025-09-05
51CTO 2025-09-04
51CTO 2025-09-03
51CTO 2025-09-02
51CTO 2025-09-01
51CTO 2025-08-31
51CTO 2025-08-30
51CTO 2025-08-29
51CTO 2025-08-28
51CTO 2025-08-27
51CTO 2025-08-26
51CTO 2025-08-25
51CTO 2025-08-24
51CTO 2025-08-23
51CTO 2025-08-22
51CTO 2025-08-21
51CTO 2025-08-20
51CTO 2025-08-19
51CTO 2025-08-18
51CTO 2025-08-17
51CTO 2025-08-16
51CTO 2025-08-15
51CTO 2025-08-14
51CTO 2025-08-13
51CTO 2025-08-12
51CTO 2025-08-11
51CTO 2025-08-10