🔥51CTO热榜:2026-04-30

Harness常被误解为安全脚手架或外围组件集合。但其深层角色是认知环境的设计者。它调控进入Agent感知场的内容、跨轮保存的内容、可调用的操作、需要审批的动作、暴露供修正的中间状态、可检测与恢复的故障类型。
今天一个小更新之后,被灰度到的幸运鹅首页已经出现了识图模式,下面还有一行小字表示图片理解能力内测中。
伦敦大学学院(UCL)、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web,让现有多模态模型像人类一样使用网页。
你跟我说小克专门为设计推出的工具,竟然没打过Kimi最新通用旗舰模型?
生产系统往往会组合使用多种模式——比如用 Orchestrator-Subagent 管理整体流程,但在协作密集的子任务上使用共享状态;或者用消息总线做事件路由,但每种事件类型由一个 Agent 团队来处理。这些模式是构建块,不是互斥选项。
Doc-V* 由小米大模型 Plus 团队和华中科技大学 VLRLab 团队合作提出,一种从「静态阅读」到「主动探索」的多页文档理解新范式,通过交互式视觉推理让模型像人一样有策略地阅读长文档。
这篇论文提出了 VEGA-3D,旨在释放深藏于生成大模型内部的 3D 先验知识。研究表明,生成模型不仅是一个高超的“画师”,更像是一个开箱即用的“空间知识库”。
很多开发者自诩熟悉 Linux 程序调试,却在面对偶现崩溃、无日志报错的场景时束手无策,核心原因就是没吃透 Core Dump 这一核心排障工具。
这篇文章从零实现微信扫码登录(基于微信公众平台),完整覆盖:二维码生成、状态轮询、WebSocket实时推送、JWT签发、安全防护。
当前,以大型语言模型为基座的 AI Agent 在代码语义理解、逻辑推理与自动化执行等维度的能力已超预期成熟,工程落地准确率与稳定性得到大规模验证。这一技术跃迁使全量自动化安全审计从概念验证走向可靠实践。
Corpus2Skill 的本质是一种 "编译时换查询时" 的设计哲学:把计算成本前置到离线编译阶段,将文档语料蒸馏成一棵 Agent 可直接导航的技能目录树,从而在查询时摆脱对嵌入搜索的依赖,让 LLM 的推理能力真正发挥出来。
大脑模型名叫MotuBrain,4月中旬悄悄登顶两个国际benchmark,却无人知晓来历,让具身圈大佬们猜了三周。
OpenAI刚用Deep Research抢了先手,谷歌直接掀桌!DeepMind祭出研究智能体双杀,Max版质量评分从66.1%暴拉到93.3%,知识工作自动化的军备竞赛正式进入贴身肉搏。
黄仁勋的算力帝国正在开启一场以Vera CPU为武器的「供给侧革命」,这可能会彻底改变AI数据中心的建设模 式与成本结构。
你敢信?一个活在95年前的AI,竟写出了Python代码。GPT之父下场,用2600亿Token炼出了一个「老古董」AI。
70万行祖传代码,人走了一拨又一拨,烂尾工程停摆三年没人敢碰。直到首席开发者给Claude Code写了份「说明书」,项目两周收工。
GPT Image 2之后,最强开源生图模型来了!SenseNova U1正式开源,原生统一理解和生成。它不仅能看懂图,更能「边想边画」,实现连续图文创作输出。这才是通往AGI的正确姿势。
从GPT-5.1开始,我们的模型开始养成一个奇怪的习惯:越来越多地在比喻中提及哥布林、地精和其他奇幻生物。与那些通过评估结果骤降或训练指标飙升而暴露出来的问题不同,这个错误悄然出现,并且很难定向到来自哪次更新。