🔥51CTO热榜:2025-12-23

Anthropic研究团队联合帝国理工学院、爱丁堡大学及Constellation的研究人员,发布了一项名为选择性梯度掩码(Selective GradienT Masking,简称SGTM)的新技术。
2025将尽,AI带来的不是乌托邦,而是裁员、失业与无尽的焦虑。图灵三巨头之一的Bengio无情戳破「就业平衡」谎言:少数人拿高薪,大多数人失业,社会将彻底崩盘!Anthropic CEO也表示,劳动力市场,可能马上要崩溃了。
AI不仅会做PPT,写代码,它还能理解更深层次的问题。在美国的一项偏重于文化领域的新基准测试中,中国开源模型Qwen3夺冠,DeepSeek的R1跻身前六,力压多家全球顶级的明星模型。
扎克伯格用7000亿豪赌买来的不是AI霸权,而是一地鸡毛——当控制欲压倒了创新,图灵奖得主等老将出走和新人的窒息,注定是这场焦虑狂奔下的必然代价。
Gemini 3 Flash的表现在SWE-Bench Verified测试中获得了78%的分数,比超大杯Pro还略胜一筹。
HTTPX 的设计旨在提供高性能、易用性以及良好的开发体验,是进行现代网络请求和 API 调用的优秀工具。
OpenAI 在当地时间周一发布的一篇博客文章中详细阐述了该公司为增强 Atlas 的防御能力、抵御持续攻击所采取的措施,并写道:“提示词注入攻击就像网络上的诈骗和社会工程学攻击一样,几乎不可能被完全‘攻克’。”该公司坦承,ChatGPT Atlas 的“智能体模式”“扩大了安全威胁面”。
一篇长达51页的论文研究了自ChatGPT以来的主要智能体,给出参考框架:适应性是其中关键。
被曝估值冲上千亿美元没几天,Waymo就因为当地停电全面停摆了,挡在路中间,造成城市拥堵,相关视频疯传。
一夜之间,编程SOTA模型易主,而且上线即开源,依然来自中国大模型公司。
来自上海人工智能实验室、西北工业大学、香港中文大学、北京大学、香港科技大学等机构的研究者提出了 AR3D-R1,这是首个强化学习增强的文本到 3D 自回归模型。该工作系统研究了奖励设计、RL 算法和评估基准,并提出 Hi-GRPO——一种层次化强化学习范式,通过分离全局结构推理与局部纹理精修来优化 3D 生成。同时引入全新基准 MME-3DR,用于评估 3D 生成模型的隐式推理能力。
来自新加坡国立大学、中国人民大学、复旦大学、北京大学等顶级学术机构共同撰写并发布了百页综述《Memory in the Age of AI Agents: A Survey》,尝试用统一视角为快速扩张、却日益碎片化的 “Agent Memory” 重新梳理技术路径。
你的用户疯狂点击提交按钮时,你的系统准备好迎接这场“连击风暴”了吗?在电商系统的实战中,我见过太多因重复提交导致的资损事故——用户一次点击,系统却创建了多个订单,导致库存错乱、用户重复支付、客服投诉爆棚。
总体下来的感受是 LLM 应用大部分的代码都是 prompt 提示词,普通 app 的主要内容是代码,而不同大模型应用的主要区别是提示词;反而代码大部分都是趋同的。
2025年人工智能在企业中实现突破性应用,从实验阶段转向实用阶段。八位代表性CIO分享核心经验。
macOS Tahoe 26 并不是那种开机就让人一见钟情的系统:它野心很大、很华丽,但一开始也确实有点粗糙。而 26.2 更像是它“坐稳了”的版本——不吵闹、不抢戏,却让人用起来更舒服、更可靠。
这个能让你在数据世界里“飞檐走壁”的神器,就是Python数据分析界的“瑞士军刀”——Pandas!
人类手工编写的提示词正在变得过时。AI的未来在于“意图工程“,即AI系统在内部自主生成并优化自己的提示词。
说到这里,很多前端同学可能会觉得:“这都是后端和运维的锅,跟我们“切图仔”有什么关系?”确实,在这次事故中,前端是受害者。当接口返回的数据是黑客篡改过的,前端播放器往往是“无脑渲染”的。但在安全防御纵深中,前端其实是 最后一道防线。
在这个AI算力需求爆发的时代,温度控制已经不再是简单的工程问题,而是关系到数据中心竞争力的战略问题。谁能在高功率密度的挑战中找到最优解,谁就能在下一轮竞争中占据先机。