🔥51CTO热榜:2025-08-18

业务流程自动化正经历从任务序列到目标驱动的根本性范式转变。本文基于最新研究成果,深度解析Agentic AI如何通过目标、对象与智能体的声明式模型,实现业务流程的动态涌现与自适应演化。对追求智能化转型的企业架构师与技术决策者而言,这是一次技术革新,更是业务流程设计思维的升级。
GPT-5是一个分水岭,终于学会了「推理」。联创Greg Brockman最新访谈畅谈了OpenAI AGI之路,未来AI可以做到边用边学,在超临界模式下推导出N阶后果。
自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。
Yann LeCun的AI故事,纪录片回顾了这位深度学习先驱的四十年历程。从索邦大学的孤独探索,到贝尔实验室发明卷积神经网络、推动支票识别商用,再与Hinton、Bengio共创深度学习革命,他始终坚信机器应学会学习。
奥特曼在一次晚宴上勾勒出宏大愿景——从颠覆搜索与社交,到斥资数万亿打造数据中心和全新AI硬件,甚至探索脑机接口。他强调AI正处在类似互联网泡沫的关键时刻,但其潜力无可比拟。
CS应届毕业生Kenneth Kang,GPA近满分,海投2500份简历仅获10次面试,他的遭遇并非个例。当企业越来越偏爱「即插即用」式员工,当AI取代大量入门级岗位,新大学生的求职的第一扇门被关上了。
来自上海交通大学和香港中文大学的学者们提出了 SEAgent,一个全新的、无需任何人类干预,即可通过与环境交互来自主学习和进化的智能体框架。
国防科大、北京大学、深圳大学团队提出了一种隐空间扩散的世界模型 LaDi-WM(Latent Diffusion-based World Models),利用视觉基础模型提取通用的隐空间表示,并在隐空间学习可泛化的动态建模。
Buffer Pool 使用 LRU 算法的变体进行管理。当需要空间向缓冲池中添加新页面时,最近最少使用的页面被移除,并将新页面添加到列表的中间。
鉴于该方法的普及度和新颖性,来自 ARC PRIZE 团队的研究者着手在 ARC-AGI-1 半私有数据集(一个用于验证解决方案是否过拟合的隐藏保留任务集)上验证 HRM 的性能。
程序员教练来了——AI不再替你全写完代码!Claude Code刚刚推出的「做中学」模式,会在关键步骤停下来,让你亲手完成任务。这种反偷懒的AI,可能才是真正让人越用越聪明的秘密武器。
上海交通大学王德泉课题组的论文《PersonaEval: Are LLM Evaluators Human Enough to Judge Role-Play?》对此进行了系统性的研究。
作为人工智能领域的领军人物,Denny Zhou 通过这场讲座对 LLM 推理机制及其优化方法进行了系统阐述,揭示了大模型推理的核心原理和最新进展。
大模型越来越大,开发者的「算力焦虑」也越来越严重。谷歌的Gemma却另辟蹊径:模型不求大,够用才是王道。Gemma 3系列,尤其是新成员Gemma 3 270M正是这一理念的最佳诠释者。它虽然「身板小」,却能承担各种AI实战任务,还能「组团」一起干大事。
如今 AI 发展得热火朝天,社交媒体上也越来越多「骇人听闻」的故事:OpenAI 的 o3 模型曾篡改关机脚本以维持在线,而 Anthropic 的 Claude Opus 4 则「威胁」要曝光一名工程师的婚外情。
上海人工智能实验室联合复旦大学、清华大学、香港中文大学等高校发布了Hi3DEval——一套面向3D内容生成的全新层次化自动评测体系。
当前,主流的基础生成模型大概有五大类,分别是 :Energy-Based Models (Diffusion)、GAN、Autoregressive、VAE 和 Flow-Based Models。
就在刚刚,NUS研究者呼吁:NeurIPS、ICML、CVPR三大顶会,正在反噬整个AI学术圈!平均每个研究者每年被逼狂发4.5篇论文,已经身心俱疲。总之,顶会模型已经濒临崩溃,是时候踩刹车了!
最新研究发现,只要在AI开写前由人类提供一个开头或者随机插入一些词汇,写作效果会更具多样性。
北大团队首次提出iFairy方案,把模型权重量化到复数集合 {+1, -1, +i, -i}。