🔥热词:模型

高考结束,马上要迎来志愿填报的「战场」。 AI快速迭代的今天,考生们不用在海量信息中自己苦苦摸索了。今天,夸克发布行业首个「高考志愿大模型」,推出了全新的「夸克高考知识库」。我们替广大学生和家长先体验了一番,这个免费的志愿填报大模型是否能充当你的「AI 志愿规划师」,一起来看看。 ……
现在的高考,不仅是对考生的考验,更成了大模型能力的一次「实战摸底」。尤其是数学,最能体现 AI 的硬实力。 过去一年,大模型在数学解题能力上整体进步神速,头部玩家们普遍能突破 130 分,比去年同期高出一大截。 最近,机器之心搞了一次高考数学全卷的大模型横评,战况激烈:Gemini 以 145 分险 ……
“大家好,我是阿境,人称产品界的吴彦祖,一个沉稳又不沉闷的男人。” 先问个问题 “作为一名产品经理,你真的懂得沟通吗?” 诶,先别急着回答,看完文章,再重新思考下这个问题。 产品经理在日常工作当中, 不夸张地说,沟通几乎是占据了40%的工作内容 ,与运营沟通,与开发沟通,与用户沟通,与领导沟通等。 学会如何更高效率地沟通,能够使事情事半功倍,也能够有效地推动产品项目的运转。 同时,我
最近,Google DeepMind 的研究人员表明,学习世界模型不仅有益,而且对于一般智能体来说也是必要的。在这篇文章中,我们将讨论该论文的主要发现及其对 AI 智能体未来的影响。
清华大学联合腾讯提出Scene Splatter——从一张图像出发,基于自定义的相机轨迹探索三维场景。
这次AMD发布了MI350X和MI355X两款GPU,采用3nm工艺,包含1850亿晶体管,配备HBM3E内存。
RPT 通过将传统的 next-token-prediction 重构为 next-token-reasoning 任务,并引入强化学习机制,这种推理范式转化,显著提升了模型的推理能力和语言建模性能。让模型不仅是在预测 token,而在自己定义“任务”,推理“任务”。这一过程赋予了模型类似人类的战略思考模式。它不再只是机械地记忆和预测,而是在直接交付结果!
OpenRouter会根据真实的用户使用数据生成模型排行榜。这不仅能反映市场趋势,也帮助开发者发现一些新发布或表现优异的小众模型
中兴通讯团队提出了两个新的评测指标,以及一套仓库级代码语料处理框架。
抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。
本文分别从数据和模型的角度出发,提出了统一视听场景理解的显示互助范式来实现任务间的显示互助,大量的实验结果以及可视化分析均证明了该范式的有效性。
本文将介绍在 Java 项目中集成各种大模型的方法,并以阿里巴巴 DashScope SDK 为例进行重点讲解。项目环境:SpringBoot 3.4.4,JDK 21,Maven 3.8.4。
OpenAI 的 o1 系列、DeepSeek 的 R1、Claude 的思维模型——这些“大型推理模型”声势浩大地问世,有望在机器解决复杂问题方面取得突破。与之前那些仅仅通过模式匹配完成任务的模型不同,这些系统显然能够进行“真正的”推理,甚至拥有与人类思维相符的内心独白。
V-JEPA 2 是一把“万金油钥匙”的雏形:它不依赖具体机器人或场景,训练一次可以“即插即用”。这是区别于传统机器人模型的重大突破。后者往往需要为每一个新场景单独收集数据、训练模型,而 V-JEPA 2 强调通用性。