🔥51CTO热榜:2026-04-13

开源框架Deep Researcher Agent帮你全天候自动跑深度学习实验,节省大量重复劳动。它通过自主循环完成想方案、执行、监控与反思,仅需每天五毛钱。不依赖LLM API,实现实时控制与手机端监控,真正解放研究者精力,让他们专注于思考。
当多数图像AI还停留在「会生成、不会懂空间」的阶段,京东开源JoyAI-Image-Edit,把图像编辑从平面修图推向空间智能,也让外界第一次看清:京东的AI布局,从来不是追风口,而是死磕自己最有胜算的真实场景。
南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。
世界正在剧变。AI不再只是工具,它正在变成一面镜子——照出人类最深处的恐惧与渴望。而镜子里,站着一个穿黑袍的神父,和一个名叫Claude的AI。
南洋理工、北航与合工大联合提出CARE Transformer,以非对称解耦方式并行建模局部细节与全局依赖,通过通道拆分与双交互机制,显著降低线性注意力计算开销,同时提升特征表达能力。
我们提出 T (R,O) 图结构作为灵巧手抓取的统一表征,将物体与机器手关节的几何、拓扑信息编码为节点,将其相对的位置关系表示为边。
GEN-1 在三个核心维度上都实现了跨越式提升:成功率超过 99%,速度提升 2-3 倍,只需要上代模型 1/10 的数据和微调,就能达到同样的性能表现。
这 60 道题全是「打工人」的真实活儿:整理发布会录像做海报、分类 arXiv 论文找 Baseline,全是多模态 + 多步骤的硬核挑战。
国防科技大学虚拟现实与视觉计算团队(SAW Lab)联合多所高校推出无人机实时地理定位系统「PiLoT」。
大语言模型带来了一个悖论,它们既是模拟人类思维的强大工具,也可能消解人们的认知多样性。
浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0,并提出技能内化。
根据通报,一名20岁的男子向这位OpenAI CEO的住宅投掷了简易燃烧瓶。目前嫌疑人已被逮捕。
具身智能赛道正迎来关键破局点——Vision-Language-Action即“视觉-语言-动作模型”(简称VLA)。
他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。
11:11  51CTO  MCP 已死
所谓 Model Context Protocol,也就是 MCP,本质上是一套开源标准。它的目标很明确:让 AI 模型能够更顺滑地接入外部数据源、工具,以及各类软件系统。你也可以把它理解成一种“AI 时代的即插即用协议”——有点像 USB,只不过它连接的不是硬件,而是模型与工具。
做 RAG 系统,十个团队九个栽在检索上。本文把语义检索、关键词检索、混合检索、Rerank 重排序一次讲清楚。
很多开发者能说出硬中断的基本概念,却对软中断与 tasklet 的区别、联系及应用场景一知半解,殊不知这两者正是内核高效处理中断、平衡系统性能与响应速度的核心所在。脱离软中断与 tasklet,谈论 Linux 内核中断机制,无异于纸上谈兵,难以触及内核设计的精髓。
先说说我们为什么想做这个系统。搞软件开发的朋友都知道,代码审查(Code Review)是保证质量的关键一环,但真正做起来,到处都是坑。
上周代码审查,同事一段缓存预热的代码看得我头皮发麻。他在@PostConstruct方法里加载了10万条商品数据到Redis,结果应用启动花了47秒。更离谱的是,开发环境Redis挂了,整个应用直接起不来。
Rerank 是 RAG 系统中检索和生成之间的精排环节。它的核心作用是对向量检索初步召回的候选文档做二次排序,把真正最相关的文档排到最前面再喂给 LLM。