🔥51CTO热榜:2025-09-03

OpenAI计划在印度建设至少1GW规模的数据中心,这是「星际之门」计划首次大规模进入亚洲。印度之所以重要,不仅因其庞大的用户增长潜力与低价特供服务,还因多语言应用场景。奥特曼虽淡出CEO角色,却亲自推动全球算力布局,印度成为其展现野心的关键起点。
本研究探索 SSRL,通过大语言模型 (LLM) 内部世界知识的利用,可以显著提升 Search Agent 的训练效率和稳定性。实验证明,该方法在多种基准测试中优于传统基于外部搜索引擎的方法,同时首次在 LLM 智能体领域实现了从模拟到真实 (Sim2Real) 的有效迁移。
近日,微软研究院的一个研究团队探索了使用主动式强化学习(agentic reinforcement learning)来实现这一目标,也就是说,模型会与专用工具环境中的工具进行交互,并根据收到的反馈调整其推理方式。
新规第一天,DeepSeek第一时间站出来了!接下来,所有自家AI生成内容,统统标出「AI身份」。更劲爆的是,DeepSeek主动「交底」V3/R1的模型训练细节。
开源模型GLM-4.5在伯克利工具使用榜单上超越Claude Opus 4.1,运行相同任务成本仅为1.4%。
美团这次发布LongCat-Flash-Chat,展现了一种务实的技术路线。他们没有盲目追求参数规模或者性能跑分,而是专注于解决实际应用中的效率问题。这种思路在当前的AI发展阶段,可能比追求极致性能更有实用价值。
正如我们开头提到的,经过SFT和GRPO训练(2000步)的Qwen-3-14B达到了90.91%的准确率,超过了参数量大一个数量级的 Deepseek-R1(86.67%)。
SpringBoot 的 ResponseBodyEmitter 是一个非常实用的工具,用好了能给咱们的项目带来很大的便利,提升用户体验。它不像有些技术那样晦涩难懂,只要理解了它的基本原理和用法,上手还是挺容易的。
希望本「漫游指南」能启发 AI 研究者与具体自然科学研究者,促进 AI 与自然科学之间的深度融合。
Hunyuan-MT-7B在面对不同语言的复杂语法规则、独特词汇体系以及丰富文化内涵时, 均展现出强大的适应能力与翻译水准,成为同类最佳开源模型。
GRPO 就像一个树节点,从这里开始开枝散叶。
对于入门者来说,人工智能导论可以让学生快速了解人工智能的不同分支,一般包括人工智能基础、机器学习、神经网络与深度学习、自然语言处理(NLP)、计算机视觉、强化学习等知识。
真正的“开箱即用”并非止步于默认,而是基于业务场景进行合理调优。提前识别并优化这些隐性风险,不仅能保障系统稳定性,更能避免用线上事故来“交学费”。
幂等性(Idempotence)是一个数学与计算机学概念,指的是无论对同一操作执行多少次,其结果都是相同的。对于接口而言,即使用户重复提交相同的请求,接口最终产生的效果也与单次提交一致。
戈德伯格在《Science Robotics》杂志发表两篇论文,指出想让人形机器人获得可以在真实世界应用的技能,速度会极慢——与AI聊天机器人获得技能的速度相差极远,核心原因在于可供人形机器人训练的数据太少了,与AI聊天机器人之间差了10万年。
Anthropic公司宣布将开始使用用户与Claude的聊天记录和代码编写会话数据训练其AI模型,并将数据保留期限延长至五年,除非用户主动选择退出。这一政策更新引发了广泛讨论:在默认共享数据的模式下,用户隐私究竟由谁来守护?
MateChat 是一款专为智能对话场景设计的 Vue UI 组件库,具备开箱即用、接入门槛低的特点,并提供国际化与多主题支持,能够轻松适配多端平台。该组件库持续迭代,已在 V1.1 版本中新增 Markdown 卡片渲染、高定制化主题等实用能力。
当需要对推理服务进行高级定制(如自定义推理流程、集成特殊的预处理或后处理逻辑等)时,可以考虑使用 KServe,并结合自定义的 Python 预测器来部署 vLLM。KServe 提供了丰富的扩展能力,能够满足各种复杂的业务需求。
在深层分析上,这背后往往隐藏着系统瓶颈:消费线程池设计不当、消息处理逻辑复杂、死信队列未优化、限流失效等。接下来,我通过这篇文章给大家介绍五种常见解决方案。
AgentScope 1.0为智能体开发提供了从模块化组件到工程化支持的完整闭环,其对ReAct范式的系统性实现,标志着智能体框架正从概念走向大规模应用。