🔥51CTO热榜:2025-12-04

NeurIPS 2025 的七篇获奖论文通过严谨的理论与大规模实验,揭示了大模型正在陷入思维同质化的蜂巢效应,证明了强化学习并未真正扩展模型的推理边界,同时在注意力机制、神经扩展定律及生成模型动力学上取得了物理学层面的突破。
今天,AI 与前端领域迎来重磅消息:Anthropic 正式宣布收购高性能 JavaScript 运行时 Bun。此前已有征兆——其 AI 编程工具 Claude Code 刚用 Bun 重写了原生安装程序。
本文着重介绍LLM主流架构Transformer的原理,结合我近期阅读的几本大模型原理书籍、浏览的相关文章做了深度总结+拓展阅读,希望能帮助大家理解大模型的原理。
整个系统都变成了那种流动感十足、半透明、折射光线的 UI: 模糊的菜单栏、灵动的光影、顺滑到离谱的动画、焕然一新的通知样式……总之,iOS 26:颜值爆表,未来感拉满,看着就想一直刷屏。
Fara-7B 作为微软在计算机操作代理领域的一次创新尝试,凭借其高效、紧凑的特性,为智能代理技术的发展开辟了新的道路。它不仅在任务执行效率、成本控制和安全性方面表现出色,还通过开源和社区合作的方式,邀请更多开发者参与探索和改进。
AI搜索不仅准确搜到了我,还知道我是一个云南昆明的数字游民,AI博主,甚至连我有哪些平台,做过的项目,写过的爆款文章都知道。
Bun 被 Anthropic 收购,首次将通用语言运行时纳入大模型工程体系,揭示 AI 原生运行时的结构性趋势。
Nano Banana Pro 代表的是一种从“美术工具”向“信息基础设施”的转变:图像不再只是为了吸引眼球,而是要在复杂约束下,准确承载数据、业务语境和品牌语义。无论是希望快速产出可靠素材的内容团队,还是在探索多模态工作流的工程团队,都可以从中看到下一阶段图像生成系统的轮廓。
2027年将是人类命运的关键节点!Anthropic首席科学家Jared Kaplan预警,人类将在2027至2030年面临是否允许AI进行递归自我进化的终极抉择。
在众多数据库中,PostgreSQL并非始终是那颗最耀眼的明星。然而,凭借其坚如磐石的可靠性、遵循BSD许可证的开放精神以及持续创新的强大内核,成为支撑数字时代万千应用的坚实“数字基石”。
直到Pixeltable出现,它提出一个大胆的理念:“一切皆表”。图片、文本、嵌入向量、模型输出,在Pixeltable中都只是表格的一列,而整个数据处理流程,则变成了一系列声明式计算列。
我们不会从“面向对象设计原则”这种大词讲起,而是从你已经熟到闭眼都能写出来的 C 风格 struct 开始,一步步把它改造成一个小而完整的 C++ class,顺手把 RAII 的味道带出来。
在AI原生企业中,系统学习、人类适应和市场变化会悄然引发“行为偏差”,即模型、流程和员工行为逐渐偏离设计目标。
OpenAI真的急了!最新代码截图流出,一款全新「企鹅」家族模型秘密测试,有四款推理预算不同的模型。说不定不用等到明年,就能看到GPT-5.2出世了。
DeepSeek V3.2的Agentic能力大增,离不开这项关键机制:Interleaved Thinking(交错思维链)。Interleaved Thinking风靡开源社区背后,离不开另一家中国公司的推动。
天才少年用AI日筛十亿分子!奥特曼恩师支招:不买模型卖授权。
21%的审稿意见竟全是AI生成的!「AI写,AI审」,ICLR裸奔事故从人肉搜索、金钱贿赂到全网吃瓜,这场闹剧撕开了学术圈最后的遮羞布。深度复盘这疯狂的61分钟,见证AI顶会史上最荒诞的一夜。
看参数党可能会先被吓一跳:总参数量高达 6750 亿。但别急着担心你的显存,它是经典的稀疏混合专家(MoE)架构。这意味着虽然它脑容量巨大,但每次思考时只动用其中最灵光的 410 亿参数(活跃参数)。
就像尤雨溪所说的一样,这一次变动改变巨大,可以说是 Vite 诞生以来最彻底的一次底层重构。因为:Vite 终于拥有了自己的原生打包器 Rolldown,正式向 esbuild 和 Rollup 的混合架构时代告别。
近日,由两位前谷歌研究员创办的一家名为 Ricursive Intelligence 的初创公司,引起了大家的关注,原因是该公司正在尝试开发一种能够自动设计尖端芯片的软件,如果成功就意味着,以后每家科技公司都能够从零开始构建自己的芯片了。