🔥51CTO热榜：2026-02-06

10:34 51CTO Nature和Science同时报道了一篇论文，试图根治AI幻觉

《Nature》重磅：80 亿参数小模型 OpenScholar 终结「参数崇拜」！它摒弃死记硬背，凭「检索+自查」根治幻觉，在科学综述任务上表现超越行业顶尖巨头。

10:34 51CTO 豪掷上亿只为说我不恰饭？Claude这波骑脸，奥特曼彻底急了

超级碗还没开打，AI圈最昂贵的互喷开始了！

10:34 51CTO 论文配图一键封神！北大谷歌开源PaperBanana，5个Agent全包了

科研人的深夜噩梦，终于有人来终结了！刚刚，北大联合Google CloudAI发布PaperBanana，直接把论文配图变成了全自动流水线。

10:34 51CTO Claude新模型4.6来了！更多饭碗没了：华尔街财务、编译器、安全白帽、PPT…通通失守

Anthropic上新模型，让Claude Opus 4.6来给您拜！年！了！

10:34 51CTO 从 Function Call 到 MCP-> SKILLS：AI Agent 能力扩展的演进之路

本文将从技术演进的角度，带你理解这些概念之间的关系，以及它们如何让 AI 从一个"只会说话的聊天机器人"变成真正能"动手做事"的智能助手。

10:34 51CTO 邓明扬一作论文改写生成范式！何恺明也署名了

论文中，漂移模型将生成模型分布演化的过程从“推理阶段”转向了神经网络的“训练阶段”，实现了真正意义上的单步生成（One-step Generation）。

10:34 51CTO Claude一个插件吓哭华尔街，软件公司集体暴跌，2万亿元一日蒸发

据Bloomberg报道，华尔街这次对软件股的悲观情绪，已经彻底演变成了末日论调。

10:34 51CTO 三天5k+星标，港大开源极致轻量OpenClaw, 1%代码量打造个人专属贾维斯

写代码、上网冲浪、操作电脑、定时提醒... 就像拥有了一个永不下班的 AI 助理。

10:34 51CTO 谷歌北大联手学术版Banana爆火，论文图表100%精确生成

论文作者表示，PaperBanana为全自动生成可用于出版的插图铺平了道路。

10:34 51CTO 别再无脑用AI了，资深前端都在处理的七个真实场景！

有人说AI会让新手程序员变懒，不再愿意啃那些难啃的bug。可能吧。但对我来说，AI更像是一个干活很快但需要监督的实习生——很多杂活可以交给它，但核心决策还得你来。

10:34 51CTO 首个大规模记忆湖发布，AI Infra跑步进入“记忆”时代

LLM就如同AI的“第一大脑（生物脑）”，它擅长思考、推理与即时生成，而不擅长长期、精确地存储海量事实。

10:34 51CTO 强化学习远不是最优，CMU刚刚提出最大似然强化学习

现实中广泛使用的强化学习，并没有真正在做最大似然优化。严格的理论分析显示，强化学习只是在优化最大似然目标的一阶近似 —— 距离我们以为的最优训练目标，其实还差得很远。

10:34 51CTO 登顶全球权威榜单的Agent，千帆深度研究Agent技术解析和实测

DeepResearch Bench是一个深度研究智能体设计的综合性基准，衡量系统从检索到报告生成的全流程能力。可以从这个榜单上面找个效果好的模型看看思路。

10:34 51CTO 智能必须基于世界模型？我们和蚂蚁灵波团队聊了聊

在刚刚过去的一周，蚂蚁集团旗下的蚂蚁灵波科技（Robbyant）以一种近乎「饱和式攻击」的节奏，连续四天开源发布了四款具身智能模型。

10:34 51CTO 谷歌做了个论文专用版nano banana！顶会级Figure直出

你负责写方法，AI负责画 Figure。科研打工人，终于等来「画图解放日」。

10:34 51CTO 你的 Mac 早就背着你偷偷进化了，而你居然还在用它当打字机？

醒醒吧！真正靠 Mac 吃饭的人——那些写文章的、敲代码的、做设计的、每天被几十封邮件轰炸的打工人——才是这场 AI 革命真正的受益者。

10:34 51CTO Codex 振臂一呼，众厂商热血响应： Skills 目录即将实现大一统，可惜 Claude Code 没有回应

我太能理解了，就拿 Claude Code、Codex、Gemini Cli 这仨来说吧，Claude Code 在 .claude/skills，Codex 在 .codex/skills，Gemini Cli 在 .gemini/skills。更别说再加上其他工具里，就比如 OpenCode 最开始连子目录都不叫 skills，而是 skill，后来才改的。

10:34 51CTO ICLR 2026 | 这道题是否需要用图思考？模型来告诉你！自适应思考模式切换助力通用视觉推理提升

本文提出了 mixture-of-visual-thoughts，一种自适应的推理范式：目标是将不同推理模式整合到一个模型内部并引导其进行自适应的模式选择。

10:34 51CTO Lovart上了Skills后，我感觉设计要变天了！

刚刚我发现，最强设计Agent Lovart，居然也上了Skills。说实话，我第一反应是：“这要是搞好了，设计门槛可能真要被重新定义一次。”于是我赶紧上手体验了一番，先给结论：有Skills加持的Lovart，用起来真的太香了。

10:34 51CTO AI撕掉了软件的皮

2026年1月，iShares软件ETF（IGV）单月下跌15%，创下2008年雷曼兄弟破产以来的最差月度表现。而2月3日单日跌幅达到 5% —— 这类跌法通常不是“业绩略逊”，而是“估值锚断裂”：市场开始怀疑——软件行业过去十年的定价逻辑，还能不能成立。

历史热榜