首页
热榜
诗歌
博客
美图
分享
好物
牛股
友站
互动
登录
注册
51CTO热榜
1
GPT-4o准确率仅为24%!权威中文教育基准:知识+情商的双重考验
华东师范大学智能教育学院发布OmniEduBench,首次从「知识+育人」双维度评测大模型教育能力。测评2.4万道中文题后,实验结果显示:GPT-4o等顶尖AI会做题,却在启发思维、情感支持等育人能力上远不及人类,暴露AI当老师的关键短板。
2
图灵测试过时了!奥特曼与量子计算之父提出的2.0来了
随着现在的主流大模型都能轻松通过图灵测试,这个持续了数十年的标准开始逐渐过时。奥特曼和量子计算之父David Deutsch讨论得出了一个新的图灵测试2.0标准,可以更好地衡量究竟怎样AI才算拥有真正的智能。
3
00后MIT辍学生,两年干出2000亿神话!英伟达谷歌抢投
仅用两年时间,一个从实验室孕育的AI编程神器Cursor,年度经常性收入破10亿美元,冲刺300亿美元估值。新一轮23亿美元融资中,谷歌、英伟达重金押注。四名MIT本科辍学生,如今已是妥妥的亿万富翁。
4
破解多模态大模型“选择困难症”!内部决策机制首次揭秘:在冲突信息间疯狂"振荡"
本文通过提出一个新框架,将模态跟随重新定义为“相对推理不确定性”和“固有模态偏好”共同作用的动态过程。研究揭示了一条稳健的法则:模型跟随一个模态的可能性,会随着其相对不确定性的增加而单调下降。同时,“平衡点”为此固有偏好提供了原则性的度量。
5
GitLab 曝多个安全漏洞,攻击者可注入恶意指令窃取敏感数据
本文将通过五个无可辩驳的理由,向你阐明:为什么现在,是时候“放弃”os模块,全面转向pathlib了。
6
FDA对偶锚点:模型知识迁移的新视角——从参数空间到输入空间
研究者们提出了 FDA(Model Merging with Functional Dual Anchors)——一个全新的模型融合框架。
7
低延迟服务器中的无锁设计哲学:线程池、内存池、队列的设计精髓
真正的无锁线程池其实是个伪命题,但无锁内存池和无锁队列却是低延迟系统的标配。让我从实战角度,结合顶级开源项目的设计思路,给你讲透这三个组件的设计哲学。
8
音画同步视频生成重磅开源!Character AI和耶鲁大学推出Ovi,让音、画在一个大脑里思考
Character AI和耶鲁大学的研究团队联手推出OVI(Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation)。
9
成本不到8千美元!新浪微博1.5B小模型超越近万亿参数模型
VibeThinker-1.5B证明了在逻辑推理这一核心认知领域,精巧的算法设计可以超越蛮力的参数堆砌。
10
图像编辑新神器:英伟达用拍电影思维解决图像编辑与世界模拟一致性难题
NVIDIA和多伦多大学的研究者们提出了一个绝妙的想法:假如我们不把图像编辑看作是修改一张静态图片,而是看作在拍摄一部只有两帧的微型电影呢?
11
下一代目标检测模型:3B参数MLLM Rex-Omni首度超越Grounding DINO,统一10+视觉任务
近日,来自 IDEA 研究院的团队通过仅有 3B 参数的通用视觉感知模型 Rex-Omni,打破了这一僵局。
12
震惊!我用一个脚本干掉了手写 Ansible 剧本的痛苦!
Ansible是自动化的基础,而这个工具,是“让自动化更自动”的一步。 我们不再被YAML文件牵着鼻子走,而是通过模板思维,让任务生成更灵活、更高效。
13
RAE+VAE? 预训练表征助力扩散模型Tokenizer,加速像素压缩到语义提取
VFM-VAE 通过直接集成冻结的基础视觉模型作为 Tokenizer,能够显著加速模型收敛并提升生成质量,展示了 LDM Tokenizer 从像素压缩迈向语义表征的演化方向。
14
太卷了!专属 Coding 的新一代 Arena 榜单来了,有国产模型登上榜首
就在昨天,LMArena 做出了今年最大的更新,发布了新世代大模型编码评估系统:Code Arena,这可以说是编程大模型能力评估领域的重大事件。
15
20美元,撕开人类思维鸿沟!宾大教授警告AI隐形阶层战
AI的革命,不在算法,而在使用者。同样一台机器,有人只拿它写笑话,有人靠它写论文、跑模型、生成研究报告。20美元成了新的「知识分界线」,AI正在制造一种隐形的社会分层——技术平权的时代,思维反而开始分级。真正的竞争,不是掌握工具,而是学会与它共思。
16
Anthropic发现LLM投毒攻击:仅需250个恶意文档即可创建后门漏洞
LLM的一个训练来源是开源代码库。攻击者要打开250-500个包含一致投毒文件的开源仓库并不困难。单个恶意行为者可以将这种投毒传播到多个广泛使用的LLM中。我不认为LLM训练软件足够智能,能够检测到大多数投毒尝试。这似乎可能对LLM造成灾难性后果。
17
谷歌DeepMind最新论文,刚刚登上了Nature!揭秘IMO最强数学模型
DeepMind的AlphaProof在IMO拿到接近金牌的银牌成绩。它结合大模型直觉、强化学习和Lean形式化证明,攻克多道高难题。它虽在速度、泛化和读题上仍有限,但已开启人类数学家与AI协作的新阶段。
18
一句「你还好吗」值40亿?斯坦福博士出走xAI,押注AGI共情力
AI已足够聪明,却不够温柔。Zelikman离开xAI的决定,既是技术路线之争,也是价值取向之选:我们要一台更快的计算机,还是一个更懂人的伙伴?当资本开始为「共情」下注,真正的考题是——算法能否承担理解的重量,而非仅仅生成正确的句子。
19
ICLR 2026出分,审稿员怒喷「精神病」!DeepMind研究员教你绝地求生
ICLR 2026评审结果震撼出炉:投稿量暴增至近2万篇,却迎来分数大滑坡,平均分从5.12跌至4.2。审稿人吐槽论文质量低下,甚至疑似AI生成,这场学术盛宴为何变味?
20
多模态基石CLIP揭秘:让AI真正“看懂”世界
传统的视觉模型可以标记物体,但难以描述实际发生的事情。本文将深入解析CLIP模型,这是一个连接视觉和语言的多模态模型,旨在帮助机器理解和描述图像背后的含义。本文将以openai/clip-vit-base-patch32模型为例,逐步讲解其数据流动过程。
21
当攻击快过补丁:为何 2026 年将成为机器速度安全元年
传统的季度甚至月度补丁节奏已完全失效。攻击者如今能在漏洞披露后数小时内完成武器化,远早于企业分析验证漏洞的时间,通常更远早于修复补丁的部署周期。
22
一个模型读懂所有医学数据,Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC
Hulu-Med代表了迈向整体化、透明化、高效能医学AI的重要一步,它不仅是一个高性能的模型,更是一个开源开放的研究起点和一份详尽的技术蓝图。
23
跨层压缩隐藏状态同时加速TTFT和压缩KV cache!
我们非常荣幸地宣布,我们试图回答这些问题的论文 UNCOMP 已被 EMNLP 2025 主会接收!我们不仅提出了一个高效的推理框架,更重要的是,我们提供了一个全新的理论视角来理解 LLM 内部的信息动态。
24
只演示一次,机器人就会干活了?北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗
DemoHLM以“单仿真演示驱动泛化移动操作”为核心,通过分层控制架构与高效数据生成 pipeline,破解了人形机器人训练成本高、泛化差、迁移难的三大痛点。
25
用155万模拟视频给模型上课!GVE模型一次学会9种视频检索技能
香港科技大学(广州)联合阿里巴巴通义实验室展开系统性探索,首次提出通用视频检索概念,并构建了包含16个数据集、覆盖多任务与多领域的综合评测基准UVRB;合成了155万条高质量、多模态、任务多样化的视频-语言训练对;并为多模态大模型底座量身设计了任务金字塔课程训练策略。
26
LeCun在Meta的最后一篇论文
这篇带“Le”的论文,介绍了一种自监督学习方法,于11月11日在arXiv提交,是LeCun的最新公开成果。
27
Rust 能否在后端工作中取代 Go,还是这只是炒作?
在持续压力下,堆占用更紧、长尾更晚出现,吞吐更像平滑降级,而不是随机晃。 如果要严格控资源,我会选 Rust:薄框架起步,剖析分配点,避免在高扇出里滥 clone。
28
Swift环境下构建安全iOS应用程序的方法:剖析常见安全隐患及其修复策略
本文将探讨基于Swift的iOS应用中常见的10个安全隐患,并提供切实可行的应对策略。
29
你不是错过了AI,而是看得太近:企业如何从局部优化走向系统重构
许多企业在使用AI时仍停留在“盲人摸象”的阶段:用孤立的试点衡量成败,只关注节省时间或成本,从而错失系统性变革的机会。真正的AI价值不在于单个任务的加速,而在于以系统视角重塑工作设计、消除跨部门摩擦并重新定义价值交付。
30
从静态合规到动态就绪,AI风险治理的三点实战心得
AI带来决策加速、智能化和自动化机遇,但风险深不可测,传统治理模式已难以应对自我修改和自适应的智能体。
31
2025 年,这九个 Python GUI 库让我眼前一亮
无论你是想快速开发一个小工具,还是构建复杂的企业级应用,总有一款适合你。下面就为大家介绍8个值得关注的Python GUI库。
32
MySQL并发如此高,原因竟然在这?
多个请求同时对同一条数据进行操作。如果没有任何保护措施,结果会是混乱的——某个线程还在修改数据,另一个线程已经开始读取,最后导致数据不一致。
33
又一个AI大模型项目完结:基于Spring AI快速搭建MCP服务加入LLM,完整源码已提交!
在技术选型上,Java 生态凭借其成熟的企业级能力和强大的类型系统,为构建生产就绪的 MCP 服务器提供了理想的基础。特别是 Spring AI 框架的 MCP 支持,让开发者能够基于熟悉的技术栈构建可靠、可扩展的智能服务。
34
Ingress NGINX 退役,云原生基础设施如何应对技术债与迁移挑战?
Ingress NGINX 退役事件揭示了云原生基础设施技术债、迁移路径与未来流量治理标准化趋势。
35
图文详解:如何设计一套高并发、强一致的电商订单系统?
行业内通用的解决方案是设计主动查询 + 重试机制 — 支付服务每隔1分钟查询未支付订单的支付状态,如果第一次查询没结果,会继续重试,持续查询 30 分钟。确保不错过任何一笔支付结果。
36
HashMap链表树化阈值深度解析:为什么是8而不是7或9?
在JDK 8之前,HashMap完全基于数组+链表实现。当发生哈希冲突时,新元素会被添加到链表末尾。随着元素增多,链表可能变得很长,导致查询效率从O(1)退化为O(n)。
37
百万并发场景下,微服务架构如何支撑?
微服务拆分,是高并发架构的基石。首先,将业务拆分为粒度适当的微服务,尽量设计为无状态或将状态外置。拆分应以业务边界、和数据自治为依据,确保单一服务职责明确、耦合度低且便于独立扩展。
38
GPT-5.1 发布:更智能也更“人性化“的 AI 助手
说白了,GPT-5.1 的升级就像一面镜子,一下把大家对大模型 的各种情绪都照了出来——有人觉得它更聪明更自然了,有人又担心太“像人”不太舒服。对用户来说,更像是一次新的实验:看看我们到底希望大模型离人类多近,离工具多远。
39
震惊!2026 年的 JavaScript 被悄悄换了芯:这十个隐藏特性把老前端看傻了
如果有一天,你写了十年 JavaScript, 却突然发现:你根本不会写“新 JS”了—— 那八成是 ES2026 上线的那天。它看起来只是“又一版标准”, 实际上是在悄悄篡改我们对数据、异步、类型安全的全部认知。
40
深度解析 InnoDB 如何用 MVCC 和 Next-Key Lock 实现 RR 隔离?看完顿悟!
MySQL 的事务隔离级别是一个层次分明、权衡精妙的系统。从 RC 到 RR,不仅仅是隔离性的提升,更是 MVCC 从“每次生成视图”到“第一次生成视图”的转变,以及锁机制从“行锁”到“Next-Key Lock”的升级。
41
2.4万亿参数原生全模态,文心5.0一手实测来了
全新一代主打原生全模态,最开始就把语言/图像/视频/音频放在同一套自回归统一架构里,做统一的理解与生成训练。
42
HaluMem:让AI记忆系统的“幻觉”现形——首个面向记忆系统的操作级幻觉评测基准
在 HaluMem‑Medium 上,SuperMemory 综合表现最佳;而 Mem0 系列的写入时间过长,表明其在对话处理和记忆构建阶段效率不足。在长语境下,部分记忆系统的耗时有所下降,主要源于提取记忆点的减少,而非算法优化带来的改进。
43
微软 Agentic 组织:下一代 AI 系统
你面对一道复杂数学题,不是一个人死磕,而是能瞬间召唤3-4个"分身"同时从不同角度进攻,还能动态调配任务、合并成果。这不是科幻,而是LLM通过强化学习学会的真本事。
44
Nature公开谷歌IMO金牌模型技术细节!核心团队仅10人,一年给AI编出8000万道数学题训练
谷歌DeepMind的IMO金牌模型,完整技术全公开了!延续DeepMind的命名传统,这次叫:AlphaProof。依然是Nature刊发的形式,放出了AlphaProof的完整论文,首次详细公开了其背后的技术架构和训练方法。值得一提的是,无师自通的下棋AlphaZero,也在这次论文里被多次提及。
45
GRPO训练不再「自嗨」!快手可灵 x 中山大学推出「GRPO卫兵」,显著缓解视觉生成过优化
作为首先关注 GRPO 在视觉生成中过优化现象的研究,GRPO-Guard 通过比率归一化(RatioNorm)和跨步梯度平衡,有效稳定策略更新,恢复裁剪机制对正样本的约束,并缓解过度优化。
46
2M大小模型定义表格理解极限,清华大学崔鹏团队开源LimiX-2M
轻量化、开箱即用的LimiX-2M,在科研探索和实际落地场景均有巨大潜力。它保持前代 LimiX-16M 支持分类、回归、缺失值插补等多样化能力,性能远超现有其它表格模型,同时大幅度降低了显存占用和时间消耗。
47
小红书提出DeepEyesV2,从“看图思考”到“工具协同”,探索多模态智能新维度
DeepEyesV2不仅延续了DeepEyes的视觉推理优势,更突破性地实现了「代码执行+网页搜索+图像操作」的全工具协同,从「会看细节」进化为「能主动解决复杂问题的智能体」。
48
HarmonyOS开发-媒体文件管理服务
HarmonyOS开发媒体文件管理服务前言前面我们在图片识别的时候需要读取本地图片,用户可以在本地图片中选取,也可以拍照,那么在这里,我们...
49
HarmonyOS 6 开发者必修课:四大核心能力深度解读
[toc](目录)前言在万物互联的时代浪潮中,开发者正面临着前所未有的挑战与机遇。如何让一款应用在手机、平板、折叠屏、2in1设备等多种终端上...
51CTO历史热榜
51CTO - 2025-11-15
51CTO - 2025-11-14
51CTO - 2025-11-13
51CTO - 2025-11-12
51CTO - 2025-11-11
51CTO - 2025-11-10
51CTO - 2025-11-09
掘金热榜
1
Flutter 3.38 发布,快来看看有什么更新吧
2
微信小游戏包体限制4M,一个字体就11.24M,怎么玩?
3
Dart 3.10 发布,快来看有什么更新吧
4
接口开发,咱得整得“优雅”点
5
🧸 前端不是只会写管理后台,我用 400 行代码画了一个 LABUBU !
6
面试官:JWT、Cookie、Session、Token有什么区别?
7
美团面试:接口被恶意狂刷,怎么办?
8
能让 GitHub 删除泄露的苹果源码还有 8000 多个相关仓库的 DMCA 是什么?
InfoQ热榜
1
Redis中的关键远程代码执行漏洞存在13年后终被发现
2
AI Scientist 中的上下文动态优化与自我演进|AICon北京
3
别怕被淘汰!AI现在是,将来也永远只是人类的助手|独家对话一线架构大佬 Christian Ciceri
4
亚马逊云科技携手 Intel 推出 C8i / C8i-flex 实例,进一步优化算力与能效
5
优步的Pinot查询改革:简化层和提高可观测性
6
Amazon Timestream for InfluxDB新增对InfluxDB 3核心版和企业版的支持
7
Yann LeCun终于被小扎“逼得”离职创业了!内行被外行指导、时刻担心被裁,Meta 人现在迷茫又内卷
8
没活硬整?OpenAI新发的GPT-5.1被网友狂吐槽:我不想和它聊天,我想用它工作
CSDN热榜
1
虚竹哥与机械工业出版社免费送AI书活动第十二期《DeepSeek高效辅助论文写作》
2
Java 大视界 -- Java 大数据在智能物流仓储货位优化与库存周转率提升中的应用实战
3
大话Rust的前生今世
4
Rust实战:使用Clap和Tokio构建现代CLI应用
5
内存、性能、并发、生态:Rust 凭什么与主流语言同台竞技?
6
新能源汽车动力系统在环(HIL)半实物仿真测试台架深度解析
7
Dubbo监控中心全解析:构建微服务可观测性的基石
8
2025年最新海外代理IP服务商横向测评:国外代理IP服务商哪家好?
博客园热榜
1
一个基于 .NET 8 + DDD 搭建的模块化微服务框架
2
革命你的 Git 提交消息 - GIM 1.8.0 发布了!
3
恭喜自己,挑战成功!
4
LLM应用剖析: 舆情分析多智能体-微舆BettaFish
5
DotMemory系列:2. 事件泄露引发的内存暴涨分析
6
《重生之我成为世界顶级黑客》第一章:懊悔的从前
7
银行核心账户体系、账务设计、会计核心(整合版)
8
某豪猪发的 “跑通了!Deepseek 自动生成测试用例,太牛了!”,看起来好像很厉害的样子!
V2EX热榜
1
大家认知的现在的智驾是什么水平?
2
劳动仲裁后续
3
已裸辞, 3 月份准备日本旅行, 有没有什么注意的
4
PHP 语言已经过气了吗
5
不懂就问,坐电车晕车怎么治?
6
北京还有能在下午 6 点正常下班的公司吗
7
前后端的大佬们帮忙看看,最近遇到个奇葩问题
8
我这个条件能买 35 左右的车吗?有啥推荐