🔥热榜:2025-06-10

浙江大学联合北京大学的研究团队从人类“分段思考+归纳总结”的智慧中汲取灵感,创新性地提出了大模型的推理新范式——InftyThink。
来自滑铁卢大学、港科大、中科大的研究团队,首次将推理战场从文本空间拓展到像素空间,提出「像素空间推理」(Pixel-Space Reasoning)范式。
LLM能理解现实世界和各种抽象概念吗?还是仅仅在“鹦鹉学舌”,纯粹依靠统计概率预测下一个token? 长期以来,AI社区对这一问题存在很大的分歧。
这就是光轮智能联合清华AIR、LeddarTech等机构提出的全新自动驾驶神经渲染框架SA-Radar。
这次生病让她明白了立体视觉对空间交互具有决定性作用,“就像语言模型处理文本时需要理解上下文,物理世界的交互也必须建立在三维空间表征基础上”。
艰难的实践经验揭示了构建GenAI能力过程中常见的技术陷阱,并提供了克服这些陷阱的有效策略。
小红书联合西安交通大学,采用端到端强化学习,在完全不依赖监督微调(SFT)的前提下,激发了大模型“以图深思”的潜能,构建出多模态深度思考模型 DeepEyes,首次实现了与 o3 类似的用图像进行思考的能力,并已同步开源相关技术细节,让“用图像思考”不再是 OpenAI 专属。
本文我们接着上篇文章解析转换后的 Markdown 文件,介绍下基于 Markdown 语法的文档切分方法。
在机器学习工程领域,自主智能体的研究正逐渐成为焦点。ML-Agent 为这一领域带来了新思路。它凭借创新的学习型 agentic ML 范式和高效的训练框架,实现了智能体在自主机器学习中的高效探索与优化。
dots.llm1 是一个大规模的 Mixture of Experts (MoE)语言模型,在总共 1420 亿参数中激活 140 亿参数,借助精心设计且高效的数据处理流程,dots.llm1 在训练 11.2T token 高质量数据后,达到了可与 Qwen2.5-72B 相媲美的性能。为促进大模型社区的研究工作,hi lab团队开源了Pretrain阶段每经过1T token的中间训练检查点
基于向量的检索无疑是 RAG 成功的重要因素。向量嵌入非常适合映射文本的语义含义。它们也适用于不同大小的文本。你的查询可能是一句话,但你的文档存储包含整页文章?——向量搜索可以处理。
10:24  百度贴吧  孩子高考砸了我的天也塌了
10:25  虎扑  这是要爪子?