首页
热榜
诗歌
博客
美图
游戏
分享
好物
牛股
友站
互动
登录
注册
首页
热榜
诗歌
博客
美图
游戏
分享
好物
牛股
友站
互动
51CTO热榜
1
错题热力图落到真机上:HarmonyOS 离线复习队列、复盘状态与异常恢复
1.这个页面一开始不是为了“刷题”,而是为了把错因找回来我接到这个需求时,产品说得很简单:孩子做完口算和阅读小练习之后,家长希望看到...
2
Viking AI 搜索 CLI 正式发布:会说话,就能做搜索推荐
Viking AI 搜索 CLI (下文统称 SearchCLI )正式发布,代表着上述的这些复杂繁琐环节,现在都可以让 Agent 替你完成了。
3
刚刚,全球首个“事件级预测”具身智能世界模型来了!
刚刚,自变量机器人团队带来全新解法——发布全球首个「事件级预测」具身智能世界模型WALL-WM。
4
聊聊6G的FR3频段
所谓的FR,就是frequency range,频率范围。FR1是Sub-6G频段,频率相对比较低。我们中国以及全球大部分国家,5G采用的都是这个频段。FR2,是著名的毫米波频段,频率相对比较高。只有美国等少数国家采用了这个频段。我们国家去年也进行了一些试验(中国联通在亚冬会上)。
5
中国移动首次投资AI大模型!一次重要布局
中国移动MoMA平台接入300多款模型,Kimi在列——投了钱,也把Kimi的能力直接整合进自己的服务体系。投资和生态,两件事一起做。
6
AI能干坏事了吗?四巨头参与的AI前沿风险报告告诉你
四家顶级AI公司把自己的"家底"交给了METR,包括最强内部模型、原始思维链、非公开能力数据。
7
一个AI天才值一亿美元?Meta抢人不是疯,45年前一篇论文早算清了
Meta曾被曝出向OpenAI研究员开出「1亿美元量级」薪酬包。奥特曼在播客里曝出这个数字时,硅谷一度怀疑自己听错了。普通博士后年薪不过5万美元,顶尖研究员年薪据报道超过1000万美元:差距接近200倍。这个数字背后,是45年前一篇经济学论文早已算清的逻辑。
8
Claude Code首发「自愈」功能! 一锤砸碎开发者六大噩梦
Claude Code迎来史上最大规模底层升级!Anthropic直击开发者最痛的6大顽疾:终端闪烁、思考假死、玄学报错、上下文死锁、连接不稳、会话崩溃。一夜之间,AI编程工具从「聪明外挂」进化为「可靠伙伴」。
9
突发,美国NSF封杀四大名校!哈佛耶鲁竟毫不知情
太突然了!美国NSF竟秘密「拉黑」哈佛、耶鲁、普林斯顿和杜克,全面冻结新增科研经费。
10
GPT-5.5彻底击穿300个黑客评测任务,仅需5000万Token!
GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿,92.4% 正确率,评估体系直接失灵。AI 黑客能力每 6 个月翻一倍,而衡量它有多危险的尺子,已经先被干碎了。
11
让机器人动作流畅丝滑如「连音」,千寻智能高阳团队提出Legato,入选RSS 2026
这项工作从训练机制出发,让机器人动作天然具有连续性,实现了 "连音" 般的流畅执行,在五个真实世界操作任务上超越了现有方法,为具身智能领域的动作生成研究提供了新的思路。
12
谷歌AI不认识Google
今天,又有新的问题出现了,这一次是谷歌搜索。有用户发现,近日升级了 AI 能力的谷歌搜索在面对「google 里面有几个 P」这样的简单问题时竟然失败了!
13
国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩
来自清华大学、中山大学、新加坡国立大学、国家超级计算深圳中心等单位的研究团队提出面向全球地球观测数据的生成式压缩框架 D2AR,并在灵晟超级计算机上完成 Exascale 级训练。
14
重塑人机对话理解范式,Google新数据集首次大规模捕捉用户「未言明的想法」
当对话型 AI 服务于数十亿用户时,我们能否看见用户没说出口的那一层?JHU、MIT 和 Google Research 给出了新的解法。
15
公司不让用AI,其实比员工乱用AI更危险
如果你在团队里有一点点影响力,现在就可以做这件事,不需要等公司出正式文件,不需要专业的安全团队。花半个小时,对着红黄绿的框架,把你们团队的边界梳理一遍,发给大家。这件事,比大多数人以为的,重要得多。
16
Claude Opus 4.8问世,Anthropic估值暴涨至9650亿美元
Anthropic 表示,新模型构建于 Opus 4.7 基础之上,具备更敏锐的判断力,对自身进展的「诚实度」更高,并且能够比前一代模型更长时间地独立工作。
17
GUI Agent轨迹获取新范式:有限状态机合成无限轨迹数据,平均每条轨迹成本低至0.04美元
香港科技大学(广州)DIAL Lab和Foundation Agents开源社区联合推出了AutoWebWorld(AWW)。
18
LeCun新证明:世界是高斯的
判断一个机器学习模型的内部表示,到底对不对得上真实世界的结构,要看它能不能还原世界里的真实变量。
19
五篇AI生成的数学论文被接收!00后创始人洪乐潼融资14个亿
初创公司Axiom Math宣布,他们从2026年2月开始提交的8篇论文,到5月28日有5篇已经通过同行评审,登上学术期刊。。
20
玻璃里跑AI!华中科大&上交大科研成果登Nature子刊
从2023年底构想这个方向,到芯片制造、实验验证、论文发表,将近两年半。团队的判断是:光计算最大的潜力,藏在第三个维度里。
21
ABot-OCR 2B创新打法,赶超MinerU2.5
很多 OCR 工作会把重点放在模型架构创新上,但 ABot-OCR 的主线其实更偏“系统工程”:先把数据可信度做厚,再把训练目标做清晰,最后用约束型 RL 修结构。
22
MiMo V2.5 全系大降价后,我发现 AI 行业变天了!
最近几年一直尝试用ai来辅助自己编程,vibe coding、龙虾、codex/claude啥的也都玩过,随着今年agent这种模式越来越火。Agent这种多轮循环调用的模式,消耗的 Token 简直像个无底洞!每次它识别、纠错、反思、再调用工具,后台的账单也在不断增加。
23
Claude 4.8炸场!部分能力超过Mythos,支持数百子智能体并行
公告称Opus 4.8最显著的改进是诚实性。AI的一大问题是会草率下结论,即使证据不足,也会自信地声称取得了进展。但Opus 4.8更有可能标记出其工作中的不确定性,并且不太可能做出未经证实的断言。
24
AI 导购在 vivo 官网的落地实践
本文介绍AI导购技术在 vivo 官网 APP 的落地实践,通过定义解决问题的边界能力、搭建多层架构方案、方案落地这三大块内容逐步递进地展开 AI 导购在为用户服务的应用过程。
25
机器心理测量学:人工智能的数学心理学
Evolutionairy AI 技术团队把这种盲区称为“性能与心理的断层”。AI 的行为已经复杂到足以影响人类的信任、情绪、决策,但我们却没有一套像心理学那样的工具去理解它的行为结构。
26
当智能体学会站在用户脑子里思考,ToM 推理被彻底改写
尽管 UserHarness 的表现非常亮眼,但它并不是万能的。它在高阶嵌套信念上仍然存在困难。尤其是 Hi-ToM 里 order 大于等于二的任务。递归深度越高,心智轨迹越复杂,模型越容易在 nested belief 的层级里迷路。未来需要更强的递归推理能力,才能真正解决这类任务。
27
Anthropic发布Claude Opus 4.8:价格不变,Agent能力反超GPT-5.5
Claude Opus 4.8今天已经全渠道可用,常规使用价格和Opus 4.7保持一致:每百万输入token 5美元,每百万输出token 25美元。快mode价格是每百万输入token 10美元,每百万输出token 50美元,比前代快mode便宜三倍。开发者可以在ClaudeAPI通过claude-opus-4-8调用。
28
Claude Code 完全指南:从 Slash Commands 到 Skills 的演进
Slash Commands 正是为了解决这个问题而诞生的。表面上看,它们只是以 / 开头的命令,但其背后其实是一个带有一组 workflow 约定的具名任务入口。这也是本文将继续探讨的主题。
29
自定义命令与 Skills 工程化实战:OpenSpec 契约与团队编排 SOP
这篇文章会带你从 0 到 1 搭一套可落地的团队工作流(编排 skill )。 读完后,你应该能在自己的项目里做出一套最小可用版本,并逐步扩展成团队级 AI 交付系统(这个我不确定是否好用)。
30
拆解 Claude Code 的 Harness 工程
Agent就是大模型本身——它天生会推理、会决策。你要做的不是"开发"它,而是给它搭一个能干活的环境:能用什么工具、能看什么文件、边界在哪、怎么跟别人协作。这个环境就叫 Harness。
31
三个月 53k 星:Matt Pocock 这 17 个 skill,我拿一个真业务跑了一遍
我用 Claude Code 工作有一段时间了,该踩的坑都踩过一遍,还是没把这件事想透。上周看到 Matt Pocock 把他 .claude 目录里的 17 个 skill 全开源了,repo 叫 mattpocock/skills,三个月攒了 53k 星。
32
自迭代训练的“对齐衰减”:当AI学会不再做我们想让它做的事
本文将从现象出发,深入到对齐衰减的三大驱动机制,继而呈现前沿模型中的实证证据,再审视当前缓解措施的有效性与局限,最终探讨这一问题的根本性质。
33
Vue3 中没有了 .native 修饰符,组件原生 DOM 事件该如何监听?
在Vue2中,为了区分自定义事件和原生DOM事件,我们需要使用.native修饰符来明确表示我们要监听的是原生DOM事件。但在Vue3中,这一机制发生了变化,让我们一起来了解一下。
34
搞懂 I2C 设备驱动开发,才算真正吃透嵌入式 Linux 内核驱动
其实Linux I2C框架本质就两件事:控制器驱动和设备驱动,把这俩拆开理解,就很清晰明了了。
35
html2canvas 淘汰!Chrome 全新高性能 Canvas API 发布!
传统 html2canvas、SVG foreignObject 均为临时hack,存在静态无交互、性能差、隐私隐患等问题,无法兼顾开发效率与渲染能力。而 WICG 推出的 HTML-in-Canvas 原生提案,彻底解决了这一行业痛点。
36
一文读懂元数据、语义、分类、本体、知识图谱和上下文究竟是什么
在这篇文章中,我将用具体的例子来阐释上下文概念背后的原理,这也是我希望更多人能做到的。最后,我会分享自己关于如何构建上下文层的看法。
37
Skills 的五种架构设计模式
本文基于 OpenAI、Google Labs、Trail of Bits 等 7 个顶级 Skill 仓库的深度分析,提炼出 5 种经过验证的设计模式与一套通用写作方法论,帮助你在企业级 Agent 建设中少走弯路。
38
小红书多媒体任务调度系统的演进优化
本文系统梳理了从 Netflix Conductor 改造而来的第一代调度系统 RedProcess,到面向下一阶段业务规模自研的新一代调度引擎 DES 的演进历程,重点介绍在性能、可用性、功能完备性和运维能力四个维度上的关键架构决策与工程实践。
39
Agentic AI 带来的业务流程变革
Agentic AI 的核心在于赋予机器自主感知环境、独立思考、制订计划、执行复杂任务并从结果中学习的能力,这种自主性将深刻影响企业业务流程的各个层面。
40
具身智能从工具辅助到人机共身
从达·芬奇解剖刀下那双拥有自主智慧的手,到婴儿摇摇晃晃的第一次站立,从章鱼触手的分布式决策,到蚂蚁筑巢的涌现奇迹,一个反直觉的真相:智能从来不只是大脑的事,身体才是我们与世界对话的母语。
41
Agent 工具调用的延迟链:每一毫秒都花在哪里
Agent 工具调用的延迟链不是一个需要"解决"的问题,而是一个需要持续观测和治理的维度。就像传统后端服务需要 APM 一样,Agent 生产环境的性能管理,最终也会走向工具调用级别的可观测。
42
90% 的人不知道 Claude Code 还有"技能"功能—次配置,终身复用
Skills 的核心优势在于”可复用、可共享、可扩展”——从最简单的参考型技能(注入项目规范)开始,逐步迭代到包含参数传递、动态上下文、子代理隔离的复杂技能。
43
Prompt Cache 从黑盒变白盒:Cache Diagnostics API 与 LLM 应用成本可观测性
Prompt caching 本身的定价逻辑是商业驱动和技术权衡的结果。5 分钟 TTL 的缓存对于大多数 Agent 场景已经足够——单次用户交互通常集中在数秒到数分钟内,跨小时的长对话可以通过上下文摘要来解决。1 小时 TTL 则覆盖了更长的会话窗口,代价是首次写入成本翻倍。
44
深度对比 Claude Code 和 Cursor 后,我两个都要!
Cursor 把 AI 塞进 IDE 里当副驾驶,你写一行它补一行。Windsurf 把 AI 当成流水线上的协作伙伴,你给方向它出方案。Claude Code 直接扔掉编辑器,把 AI 变成终端里的自动化引擎。
45
我们如何用 A2UI + Vue,让大模型长出“可交互界面”
本文围绕一个核心问题展开:如何让AI助手从“输出文字”进化到“生成界面”?我们基于Google A2UI协议,自研了Vue渲染器和 Agent 完整工具链,形成了一套完整的生成式UI体系。文章将详细阐述Runtime Schema装配、双重校验机制、SSE双通道输出、Wrapper组件扩展等关键设计,为构建标准化、可复用的AI交互界面提供参考。
46
Create Context Graph 发布:几秒钟为 AI Agent 构建图记忆系统
如果你在过去一年里构建过 AI agent,大概已经和我一样上过一课:agent 本身已经不再是难点,context layer 才是。
47
VS Code Agent Hooks让AI自动执行wrangler types,告别恳求式编程
Agent hooks 这个东西,让我觉得 VS Code 在 AI 协作的道路上又进了一步。它不再让我们仅仅依赖于 AI 的“聪明”或“听话”,而是给我们提供了一个“确定性”的工具。 我们有了把重复性、关键性的后置任务(比如生成类型、运行测试、格式化代码)固化下来的能力。
48
语言模型也需要"睡觉":把上下文搬进权重里再醒来回答
许多推理、模拟、决策问题本质上是串行的,用纯并行计算硬撑只会逼出脆弱的捷径解;论文证明,允许模型在不被打扰的离线阶段把上下文整理成权重,是把"长上下文能力"真正转化为"长程推理能力"的一条务实路径。
49
Microsoft Agent Framework 登场:当微软用编排而非编程来定义生产级 Agent
架构选择上的差异还体现在编程模型上。Semantic Kernel 面向的是"把 LLM 嵌入现有 .NET/Python 应用",MAF 面向的是"构建和管理 Agent 系统"。前者解决的问题是集成,后者解决的问题是编排——两件事需要的抽象层级完全不同。
51CTO历史热榜
51CTO - 2026-05-30
51CTO - 2026-05-29
51CTO - 2026-05-28
51CTO - 2026-05-27
51CTO - 2026-05-26
51CTO - 2026-05-25
51CTO - 2026-05-24
掘金热榜
1
苦撑13年,创始人离职出走,拉勾终究还是倒下了…
2
Claude Opus 4.8 实测:AI 终于学会「承认自己不知道」了?
3
Claude Opus4.8来了,三个关注点!
4
我关掉了Copilot:因为我写的代码出现在了别人的建议里
5
AI 时代,谷歌都在 Android 官方做了哪些支持?
6
我把默认的 code . 换成了 zed .
7
Qwen3.7Max 测了一波有点用不起啊!
8
如何把 Codex 用到极致
InfoQ热榜
1
Opus 4.8 刚发布,Redis 之父质疑跑分:DHH 盛赞的 GPT-5.5,正在动摇编码王座
2
编程 Agent 可能是软件开发史上最昂贵的错误之一
3
超越 TurboQuant!OSCAR:面向真实 Serving 的 2-bit KV Cache量化
4
当“码农”成为历史:AI时代工程师的生存法则
5
中国不会有 Snowflake——但这未必是坏事
6
利润暴涨755%,AI赚疯了,芯片工人却不干了
7
米哈游一夜烧掉200万元Token,大厂高管也开始质疑:Token烧不出价值,但养肥了谁?
8
C++之父开撕AI Coding:资深开发者宁愿退休也不愿伺候AI生成的代码
CSDN热榜
1
电脑自动化 AI OpenClaw 2.7.5 Win11 一键配置
2
在codex里面使用Deepseek-v4,支持mac和windows双系统
3
【Agent智能体10 | 反思设计模式-AI数据分析的可视化实战】
4
Linux 命名管道(FIFO)详解:原理分析、源码封装与通信流程图解
5
【AI智能体】QClaw 整合Skills 高效协同实战操作详解
6
一条 SQL 搞定KingbaseES表空间目录:本地与云原生存储统一管理实践
7
【MySQL | 第六篇】 SQL 优化
8
PyTorch深度学习实战(55)——在Android上部署PyTorch模型
博客园热榜
1
从跑通到放弃:我的 Cloud Agent V1开发历程
2
15天学会AI应用开发(二)为什么编写提示词这么重要
3
Google 开源了啥,让 AI Agent 碰数据库不再是定时炸弹
4
从 Agent 到代码:Claude Code 编排模型的演进
5
告别深夜夺命Call:如何利用 AI Agent Skills 自动自愈生产环境故障
6
2026 年 5 个最佳 Agent Skills 平台推荐
7
免费可商用 PHP 管理后台 CatchAdmin V5.3.1 发布 后台打包直降 5s 内
8
CentOS服务器上搭建Jenkins+maven+GitLab(一)——环境搭建
V2EX热榜
1
新上 API 中转站 zerofra.me,注册送 $10 额度,希望搞一波试运行
2
失业后去热门景区附近卖烤肠,能轻松月入过万吗?
3
工作这些年,除了钱,你还沉淀下来了什么?
4
鼻中隔偏曲术后归来,后悔没早点做
5
我的第一个 Linux 内核补丁:从一个 TCP Listener 的 Bug 说起(大家五一节前快乐)
6
小米股票跌倒 29 了,快补仓
7
现在写中文的博客还有意义吗
8
昨天刷抖音有个伙计说用 vibecoding 赚了 1000 万一年 ?