🔥51CTO热榜:2026-02-06

《Nature》重磅:80 亿参数小模型 OpenScholar 终结「参数崇拜」!它摒弃死记硬背,凭「检索+自查」根治幻觉,在科学综述任务上表现超越行业顶尖巨头。
超级碗还没开打,AI圈最昂贵的互喷开始了!
科研人的深夜噩梦,终于有人来终结了!刚刚,北大联合Google CloudAI发布PaperBanana,直接把论文配图变成了全自动流水线。
Anthropic上新模型,让Claude Opus 4.6来给您拜!年!了!
本文将从技术演进的角度,带你理解这些概念之间的关系,以及它们如何让 AI 从一个"只会说话的聊天机器人"变成真正能"动手做事"的智能助手。
论文中,漂移模型将生成模型分布演化的过程从“推理阶段”转向了神经网络的“训练阶段”,实现了真正意义上的单步生成(One-step Generation)。
据Bloomberg报道,华尔街这次对软件股的悲观情绪,已经彻底演变成了末日论调。
写代码、上网冲浪、操作电脑、定时提醒... 就像拥有了一个永不下班的 AI 助理。
论文作者表示,PaperBanana为全自动生成可用于出版的插图铺平了道路。
有人说AI会让新手程序员变懒,不再愿意啃那些难啃的bug。可能吧。但对我来说,AI更像是一个干活很快但需要监督的实习生——很多杂活可以交给它,但核心决策还得你来。
LLM就如同AI的“第一大脑(生物脑)”,它擅长思考、推理与即时生成,而不擅长长期、精确地存储海量事实。
现实中广泛使用的强化学习,并没有真正在做最大似然优化。严格的理论分析显示,强化学习只是在优化最大似然目标的一阶近似 —— 距离我们以为的最优训练目标,其实还差得很远。
DeepResearch Bench是一个深度研究智能体设计的综合性基准,衡量系统从检索到报告生成的全流程能力。可以从这个榜单上面找个效果好的模型看看思路。
在刚刚过去的一周,蚂蚁集团旗下的蚂蚁灵波科技(Robbyant)以一种近乎「饱和式攻击」的节奏,连续四天开源发布了四款具身智能模型。
你负责写方法,AI负责画 Figure。 科研打工人,终于等来「画图解放日」。
醒醒吧! 真正靠 Mac 吃饭的人——那些写文章的、敲代码的、做设计的、每天被几十封邮件轰炸的打工人——才是这场 AI 革命真正的受益者。
我太能理解了,就拿 Claude Code、Codex、Gemini Cli 这仨来说吧,Claude Code 在 .claude/skills,Codex 在 .codex/skills,Gemini Cli 在 .gemini/skills。更别说再加上其他工具里,就比如 OpenCode 最开始连子目录都不叫 skills,而是 skill,后来才改的。
本文提出了 mixture-of-visual-thoughts,一种自适应的推理范式:目标是将不同推理模式整合到一个模型内部并引导其进行自适应的模式选择。
刚刚我发现,最强设计Agent Lovart,居然也上了Skills。说实话,我第一反应是:“这要是搞好了,设计门槛可能真要被重新定义一次。”于是我赶紧上手体验了一番,先给结论:有Skills加持的Lovart,用起来真的太香了。
10:34  51CTO  AI撕掉了软件的皮
2026年1月,iShares软件ETF(IGV)单月下跌15%,创下2008年雷曼兄弟破产以来的最差月度表现。而2月3日单日跌幅达到 5% —— 这类跌法通常不是“业绩略逊”,而是“估值锚断裂”:市场开始怀疑——软件行业过去十年的定价逻辑,还能不能成立。