🔥51CTO热榜:2026-01-12

在人类满分都罕见的普特南数赛上,AI直接12题全对拿满分。陶哲轩等大佬预言AI已经取得了重要里程碑,再加上GPT-5.2 Pro在数学上强到「离谱」的表现,那种「奇点将近」的直觉,真的压不住了。
随着 LLM 大模型能力的不断提升,并与 RAG、MCP、Skill 的结合,使得 Agent 智能体与完整的计算机环境(Computer/Phone)交互成为可能。这个过程中,一方面不断产生新的技术方案,一方面又不断的优化设计。就像 Skill 的出现,它不是替代 MCP,而是更准确的使用 MCP 能力。
DeepSeek春节憋大招,V4要当「编程之神」!一个月后代码圈变天?
知名开源项目OpenEvolve作者,刚刚用一篇长文揭示了70M小模型的几个重要发现。
Soben(埃森哲旗下公司)发布的一篇深度报告,通过十大趋势与三大区域市场的详尽分析,向我们展示了一个正在极速膨胀却又受困于物理现实的庞大产业图景。
上海AI Lab联合多家机构开源的Yume1.5,针对这一核心难题提出了时空信道联合建模(TSCM),在长视频生成中实现了近似恒定计算成本的全局记忆访问。
大模型有没有可能「意识到自己正在犯错」?在 Token 概率不可靠的情况下,是否有其他信号可以指导更可靠的生成?
清华大学研究团队提出了 MARSHAL框架,通过策略游戏中的多智能体自博弈和端到端强化学习,激发大模型的在通用多智能体系统中的推理决策能力。
随着AI生成内容泛滥、平台审核松动,消费者对社交媒体与网红推荐的信任正在快速崩塌,品牌被迫重新押注电子邮件、短信等自有渠道。与此同时,AI浏览器与智能体在提升便利性的同时,也引发了隐私、版权与客户关系去中介化的风险。
当 AI 能够完美地消化信息、生成代码、甚至替代交互时,所有依附于「人类注意力」和「人类访问量」的商业逻辑都面临着重构的风险。
这篇试图说清楚:政府/机构网站的技术架构为什么容易获取、多信息源适配的工程技巧、NocoDB 作为轻量数据库的使用体验、钉钉推送时踩过的坑(图片显示问题、OSS 权限)、LLM 生成日报摘要的 Prompt 设计,以及从本地测试到服务器部署的完整链路。
本文详细介绍传统TDD开发模式的发展,同时介绍了传统TDD模式的种类的弊端,并给出笔者基于传统TDD开发模式优化后的汲取TDD核心思想的一种以测试设计驱动开发模式。
谷歌 Gemini 数据联合负责人 Andrew Dai 联手苹果首席研究科学家 Yinfei Yang,隐身创办 AI 新秀 Elorian。首轮将融资 5000 万美元,剑指「视觉推理」这个下一代大模型的核心问题。
2026硅谷「爽文剧本」已备好:Ilya将卖掉SSI、OpenAI可能吞下Pinterest、特斯拉将接盘xAI、苹果AI有望翻身……这些惊人预言到底哪些会在2026年成真?
今天就带大家从原理到实战,一步一步搞懂 systemd,并学会写一个自己的 systemd 服务单元。
从巅峰时期的程序员圣地,每个月都有30w+新问题层出不穷,到如今用户凋零、流量暴跌,Stack Overflow似乎在toC市场已遭抛弃。
英伟达的一篇新论文却指出,在进行多奖励优化时,GRPO 可能不是最佳选择。他们提出了一种新的策略优化方法 —— 组奖励解耦归一化策略优化(GDPO)。
近日,香港大学、香港科技大学(广州)、南方科技大学、斯坦福大学、加州大学圣塔克鲁兹分校的研究团队合作,在人工智能顶级期刊 IEEE TPAMI 上发表重磅工作,对 GIA 进行了全方位的分类、理论分析与实验评测,并提出了切实可行的防御指南。
2026年初,全球科技版图发生剧烈震荡。谷歌(Alphabet)市值一度冲破3.97万亿美元,超越苹果,重回全球市值第二。从被ChatGPT“偷袭”到全面反击,谷歌这十年到底做对了什么?
来自 MIT、NVIDIA、UC Berkeley 等机构的研究者提出了 FoundationMotion:一套完全不依赖人工标注的自动化数据管线。