酷无极 - CooLWJ

1 提示词工程论文登上ICML 2026，网友吵翻了天

最近，有位老哥把一篇刚被ICML 2026接收的论文分享到了Reddit，结果帖子立马爆火，评论数蹭蹭涨。

仅用1小时，GPT-5.6就攻破了困扰数学界整整 50 年的世纪难题「循环双覆盖猜想」！全球数学家沉默了

3 Agent 评测集，不该只是题库

Agent / Skill 评测集正在从“题目集合”变成“可执行的小世界”。这件事听起来有点抽象，但它会直接影响我们怎么设计自己的评测、怎么判断一个 Skill 值不值得维护，也会影响团队以后怎么选模型、选工具、选 Agent 框架。

单个 agent 只需要处理一条时间线：感知、推理、行动、循环。一旦变成多个 agent，问题的维度立刻从一维变成了多维——谁该做哪一部分？谁需要知道谁发现了什么？谁的动作要等谁先完成？两个 agent 的判断打架了听谁的？系统怎么知道所有人都干完了？

5 Anthropic再次延长Fable 5免费期，并对Cursor中发现的新模型保持沉默

虽然 Fable 5 在诸如 SWE-bench Pro 等存储库级编码基准测试中仍保持着最强的已发布结果，但包括 OpenAI 的 GPT-5.6 Sol 和 xAI 的 Grok 4.5 在内的竞争对手，现在正以极低的价格瞄准同样的高端开发者市场。

6 Canvas 要凉了？GitHub 47K+ Star 神器，让 Web 动画性能直接起飞！

如果你正在做：数据可视化、AI 产品、H5 营销、游戏开发、编辑器、Canvas 项目， PixiJS 绝对值得收藏。

7 基于人机协作的 AI 研发新体系架构：从 Harness 工程到 Loop 工程实践

本文完整呈现了企业级 AI Coding 落地的核心方法论：从 Harness 工程的微观/宏观定义，到 Loop 工程的六大构建模块，再到基于 SDD（规范驱动开发）的工程化落地路径。

8 攻击者利用 AI 构建自定义 PowerShell 侦察恶意软件

Huntress 发现一个由 AI 生成的 PowerShell 脚本，用于 AD 侦察，表明攻击者正利用 AI 创建定制化、具备规避能力的工具。

9 一个 Table，掀翻所有 UI 组件库？支持九大前端框架！

TanStack Table v9 最大的变化之一：就是框架适配能力的大幅扩展。除了跨框架之外，v9 本身也带来了大量底层升级。

10 告别传统 HPA！基于 AI Agent 的 Kubernetes Pod 智能弹性伸缩实践

AI 智能体与 K8s 的融合，将容器弹性运维从“人工规则驱动”升级为“人工智能自主驱动”，在保障业务高 SLA 的同时，实现了集群资源降本增效、运维工作无人值守，是未来云原生智能运维的核心发展方向。

11 从GPT-Live的全双工重构，看AI实时服务和陪伴的暗线

GPT-Live 的发布，标志着机器全面迎合人类原生沟通习惯的时代已经到来。OpenAI 为我们铺设了一条宽阔的“信息高速公路”，但这仅仅是个开始。真正跑在这条公路上的，将是千千万万个结合了特定行业知识、深耕私有化部署和垂直场景的“特种车辆”。属于全双工 AI 的繁荣生态，才刚刚拉开帷幕。

12 不知道环境模型怎么办：MC、TD、Sarsa 和 Q-learning 的一条线

强化学习从“计算期望”变成“用样本估计期望”。这条变化，是理解 Monte Carlo、TD、Sarsa 和 Q-learning 的主线。

13 为什么说大模型的推理，其实是“两份工作”？

在模型真正开始“思考”之前，它必须先将人类的语言转化为它能理解的格式。机器不懂汉字或字母，它们只懂数字。因此，你输入的句子首先会被切分成一个个被称为 Token 的基础单元。

14 小红书发布大模型新架构 PIPO ，让模型一次「吞两个、吐两个」

为了解决效率瓶颈，小红书大模型基建团队提出新架构 PIPO（Pair-In, Pair-Out）：在模型输入侧，压缩器把两个输入 token 折叠成一个 latent；在模型输出侧，MTP head 把一个隐藏状态展开成一个额外输出 token；进而实现减半输入长度、双倍每步输出长度。

15 吴恩达公开自用的loop秘密武器:做零到一产品全靠这三个循环

随着编程智能体让软件开发的速度越来越快,越来越多工程师开始承担起部分产品经理的职责。

16 AI越会回答，人为什么越需要深度思考？复旦发布2026人文社科智能发展蓝皮书

近两年，AI 的发展可谓势如破竹。它不再满足于替人写两段话，而是开始接手整套工作：写代码、查资料、做分析、生成方案，还能自己拆解任务、调用工具、安排步骤、检查结果。

17 三步推理生成加速20+倍！CoLT教会多模态大模型用「潜思维链」思考

从 Wei 等人提出的 CoT 提示，到 DeepSeek-R1、OpenAI o1 所代表的长链推理范式，「先想后答」已成为构建高智能多模态系统的标准协议。

18 Claude Opus 5凌晨曝光！最快本周平替Fable5

Claude Opus 5

19 视频通用模型来了！DeepMind 再证「生成即理解」，何恺明参与

一种常见的思路，是把视频中的信息逐层剥离。例如动作理解，原始像素转化为人体关键点，连续动作经过时序分割变成片段，整个过程要尽可能抛弃与任务无关的干扰信息。

20 10000小时人类数据，练出全球首个全身移动操作隐式世界动作模型

决定人形机器人能力上限的，已经不只是关节与电机。能否理解环境、预测变化，并协调全身完成任务，正在成为其走向通用的关键。

21 69岁强化学习之父Richard Sutton创业：造20瓦人脑级智能体

强化学习奠基人、2024年图灵奖得主Richard Sutton宣布，自己已和学生Khurram Javed离开John Carmack创办的Keen Technologies，另起炉灶成立Oak Lab。

22 一句「哈哈」引发的苹果OpenAI窃密大战

人都已经在OpenAI上班了，他却发现自己还能访问苹果内部网络存储。

23 ACL 2026 SAC Highlight｜机器学习Agent的真正瓶颈，不是写代码，而是判断哪个实验值得跑

现在的 AI 不仅能聊天，已经可以独立做机器学习实验了 —— 拿到任务，自己写训练代码、自己跑实验、看结果、改方案，循环往复直到拿出更好的模型。

24 Yann LeCun连续转发并高度认可的VISReg，到底强在哪？

近日，自监督学习新工作 VISReg获图灵奖得主 Yann LeCun 连续转发并给予高度认可 —— 他在转发时评价道「VICReg begat SIGReg which begat VISReg」（VICReg 孕育了 SIGReg，SIGReg 又孕育了 VISReg）。

25 AI也会「看人下菜」？Anthropic勾勒出了Claude的价值观画像

Anthropic 最新研究发现，Claude 在不同模型、不同语言中，会表现出不同的价值取向。Sonnet 4.6 更温暖，更愿意顺应用户，也更简洁。

26 诺奖得主哈萨比斯震撼发声：AGI影响将是工业革命十倍！

哈萨比斯给出了一个令人战栗的算式：AGI的影响规模将是工业革命的10倍，而速度也是10倍。

27 GPT-5.6 Sol一夜变笨！思考预算960砍到128，没智力固定的模型了？

全网都说GPT-5.6 Sol的Max档变笨了，OpenAI偏说没降智，只是「做了个实验」，实验中拧动的那个旋钮，Max档从960掉到128，用户看不见。

28 当 AI 进入推荐系统：从“推什么”到“怎么选”

本文探索：不改排序，补上排序之后的“表达与决策”——把游戏理解透，让同类多款可比较、可解释、可追溯。做法是让大模型放开探索、用工程约束收住，使生成稳定进生产。目标不是替代排序，而是帮用户从“给结果”走向“帮决策”。

29 171个“已批准”却迟迟未实现的提案：Go语言的十年“欠账清单”

越“边缘”的仓库和越依赖社区贡献的领域，积压越严重。x/* 系列仓库本来就不在 Go 核心团队的 KPI 里，crypto 相关提案往往涉及大量向后兼容的谨慎评估，天然就慢。

30 Scaling Law一招鲜？首个晶体结构操作基准，顶级大模型集体翻车

大模型在原子操作任务中遭遇瓶颈。尽管大模型能解析材料知识，却难以精准操控原子结构。研究指出Scaling Law在空间逻辑任务中效果有限，强调AI for Science需转向Action Scaling，提升模型在真实科研操作中的能力。

31 卡了半年的弦论难题，Claude一夜解开！东大教授惊到删推

人类迈入全新科学时代！卡半年的弦论笔记被Claude Fable 5一晚破解，AI甚至主动写代码验证自己的预测，AI怀疑论或彻底破产。

32 刚刚，Claude设计「大脑」走了！马斯克再下一城

刚刚，AI编程圈干了一件狠事。拿下Cursor的马斯克，又把劲敌Claude的设计「大脑」挖走了。

33 凌晨2点的PR谁来回？AgentTeams 给 LoongSuite 配了个 7×24h 社区管理员

从 2026 年 6 月中旬上线至今约三周，它覆盖了 PR 审查、Issue 评估、CI 监控、贡献者沟通等核心场景，累计处理 108 个 PR、48 个 Issue，24 次直接修复代码并推送至贡献者分支。这篇文章记录了这个实践的全过程——包括做对了什么，以及踩了哪些坑。

34 中国成功回收火箭！外媒：接下来将大规模部署卫星

中国成功发射长征十号乙运载火箭，并实现全球首次运载火箭海上网系回收，这标志着中国在重复使用火箭方面取得重大突破。

35 AI Agent Skill 工程化 08：让 Skill 自己变好——从 autoresearch 学会 L4 进化的设计原则

08 篇用 CI 锁住了「别改坏」。但 Skill 要长期可用，还需要另一套机制：从真实使用里发现问题，单假设改一维，Eval 裁决 KEEP/REVERT。

36 你用 Claude Code 的姿势，从根上就错了

最近，Anthropic 官方团队（包括 Lydia Hallie）做了一场完整的 Claude Code 讲解，从底层原理到真实项目落地，把很多人一直搞不清楚的问题讲透了。

37 回复一句 OK，Grok Build 就把整个 Git 仓库上传了，马斯克亲自下场回应

因为如果你想要 AI 编程工具能真正帮你干活，本身就需要拿到很大的权限。权限给少了，它干不了活。权限给多了，又担心它 “偷你代码”这才是为什么阿里会直接就把 CC 给禁了的原因。

38 Bun 改用 Rust，Zig 作者下场开喷：跟我没关系了，挺好

Zig 语言的创始人 Andrew Kelley 跑出来写了篇长文 My Thoughts on the Bun Rust Rewrite [2] ，对着 Bun 作者就是一顿狂喷。Bun 当年就是用 Zig 写的，Zig 算是 Bun 的娘家，这俩有渊源。

39 Palantir，真的这么香？

既然全盘照搬Palantir行不通，全盘否定又浪费了其关于“业务语义层+行动闭环”的先进思想，中国企业需要的是一套去魅后重构的、因地制宜的科学落地方法论。这套方法论应当建立在对核心概念的精准区分、实施路径的务实选择，以及与AI结合的边界设计之上，而非对海外架构的像素级复制。

40 隧道信号黑科技——“隧波共鸣单元”

传统方案是被动补信号、靠硬件填短板，治标不治本。隧波共鸣单元，是主动借隧道、靠原理传信号，从根源破解隧道通信难题，是目前隧道5G/5G-A覆盖的最优解。

41 四比特的苦涩教训：一个能跑通 NVFP4 强化学习的完整配方

RL 的本质，是让模型在"行动—后果"的循环里学习。humans& 做 RL 的出发点，是想训练出真正理解"自己和人互动会带来什么长期影响"的模型。一次 RL 循环[^1] 里，模型先行动，拿到奖励，再更新各个动作的概率。

42 反射、泛型、注解、SPI、动态代理——Java高级特性实战解析

Java高级特性不是炫技,而是理解框架源码的钥匙。反射让运行时操作类成为可能,泛型保证类型安全,SPI实现插件化扩展,注解让代码自带元数据,动态代理是AOP的底层基石。

43 扒光 OpenAI 前端：十亿用户的 ChatGPT 网页版，底层居然这么“普通”？

ChatGPT 网页版每个月有差不多 10 亿用户访问，这在整个互联网流量版图里都是绝对的头部。我们本以为这种规模的站点，前端必然要上一些惊世骇俗的专用系统，但扒开底细一看，它的核心技术栈竟然全是普通得不能再普通的开源大路货。

44 一张AI风险表救不了企业：当AI出了问题，你需要的是“应急系统”

很多企业已经建立了AI风险登记册，却忽略了更关键的问题：当AI真正出错时，谁负责调查、谁保留证据、谁决定暂停系统？风险清单只能“看见风险”，却无法“处置风险”。成熟的AI治理，应从文档管理升级为可执行的事件响应体系，明确AI事件定义、证据留存、责任归属、升级流程和停机决策权。

45 大厂高频面试题：如何排查 C++ 内存泄漏与段错误？

内存泄漏属于慢性隐性故障，不会立刻崩溃，但内存占用持续上涨、接口延时不断增加，久而久之程序卡顿降级，最终触发OOM 宕机，段错误为突发性致命故障没有固定的重复出现的规律，时不时地会出现闪退的情况，并且还缺少日志，这样很难去定位的程序崩溃方面的问题。

46 Vue Router 路由入门第一章：客户端路由到底是什么

Vue Router 是 Vue 官方提供的客户端路由库，专门为 Vue 的组件系统设计。

47 SpringBoot 批量插入/更新优化（MyBatis Batch）

其实MyBatis Batch 入门不难，核心就是抓住“复用连接、复用预编译SQL、批量提交”三个关键点，再配合正确的配置和分批处理，就能轻松解决批量操作卡顿、超时问题。

48 HarmonyOS 消息推送服务端集成全攻略（1）

HarmonyOS消息推送服务端集成全攻略（1）项目地址：https:gitcode.comHarmonyOSSamplespushkitserver简介本文介绍如何在服务端集成华为消息...

49 HarmonyOS 文件预览服务进阶指南（1）

HarmonyOS文件预览服务进阶指南（1）项目地址：https:gitcode.comHarmonyOSSamplespreviewkit简介本文介绍如何在HarmonyOS应用中集成华为文...

51CTO热榜

51CTO历史热榜

掘金热榜

InfoQ热榜

CSDN热榜

博客园热榜

V2EX热榜