🔥51CTO热榜:2025-08-01

近日,北京大学人工智能研究院研究员、北京智源大模型安全项目负责人杨耀东研究团队「Language Models Resist Alignment: Evidence From Data Compression」的研究荣获了 ACL 2025 年度最佳论文奖。
刚刚在上海落幕的WAIC 2025,同样未能“免俗”。并且我们还发现,随着模型应用成为发展主旋律,基础设施方面也有了更细化的新进展。
10:27  51CTO  大规模RAG实施蓝图
RAG对于大型语言模型应用至关重要,它通过检索相关信息并传递给LLM来提高准确性和减少幻觉。大规模RAG面临扩展挑战,需要关注可搜索单元定义、检索策略选择、排序策略定义以及多个用例的影响,AI搜索平台需支持自动分块、高查询量处理和灵活的索引管道。
Pypaimon 是 Apache Paimon 数据湖的 Python 客户端 SDK,基于 Py4J 实现 Python 与 Java 代码的桥接,允许开发者通过 Python API 操作 Paimon 数据湖。
Window.crypto 是浏览器提供的一套用于密码学操作的 API,而 crypto.getRandomValues() 就是其中的一员。它是一个密码学安全伪随机数生成器 (CSPRNG)。
从应用(Application)到数据(Data),再到模型(Model),DevOps的演进展现了一条清晰的价值阶梯。
研究人员首次系统综述了大型语言模型(LLM)在法律领域的应用,提出创新的双重视角分类法,融合法律推理框架(经典的法律论证型式框架)与职业本体(律师/法官/当事人角色),统一梳理技术突破与伦理治理挑战。
Karpathy 并不仅仅是又一个 AI 专家。他曾是特斯拉 AI 负责人,也是 OpenAI 创始成员之一。他参与打造的技术,正在深刻改变世界。他的洞察值得我们认真聆听——不仅是他说了什么,更是他揭示了哪些深层联系。
在软件工程的世界里,“多线程”一词往往令人敬而远之。许多开发者一听到这个术语,脑中立刻浮现出“死锁”、“竞态”、“上下文切换”、“不可重入代码”等复杂而危险的概念。好像只要一碰线程,程序就有可能立刻崩溃、数据错乱,甚至出现一些“查不出”的奇怪 BUG。
MyBatis的SQL​拦截器是其插件机制的核心,通过动态代理实现对SQL​执行过程的灵活干预。本文从原理(四大接口、动态代理)、实现(定义拦截器、声明目标、配置生效)到实践(日志统计、SQL修改、参数加密),全面解析了拦截器的使用。
北京大学与银河通用提出了自适应性【世界 - 动作】模型 Dynamics-adaptive World Action Model (DyWA)(/diː.və/),协同学习系统的动力学和机器人的精细操作策略。该项研究已被 ICCV 2025 接收。
GPT-5更近了!今天,神秘模型Horizon Alpha火遍全网,编码首测性能逆天,各种三方基准实测相继放出。就在发布前夕,OpenAI核心大脑专访坦言模型还有瓶颈,但坚信Scaling Law没有尽头。
与需要数十亿参数和强大计算能力的大型语言模型不同,White-Basilisk模型非常紧凑,仅有2亿个参数,然而,在多个用于漏洞检测的公共基准测试中,它的表现优于规模超过其30倍的模型。
刚刚,硅谷爆出新料:OpenAI企业市场份额断崖式下跌,Anthropic全面反超!
Chart-R1 的成功表明,通过精心设计的训练策略和高质量数据,即使是参数规模相对较小的模型也能在特定领域达到与大型闭源模型相媲美的性能。这一研究为构建高效、专业的领域特定 AI 模型提供了宝贵经验,也为未来多模态推理研究指明了方向。
ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。
在这家网络基础设施公司观察到的攻击中,钓鱼邮件伪装成语音邮件通知,诱使收件人点击链接收听,最终将其导向伪造的Microsoft 365钓鱼页面以窃取凭证。
香港科技大学谢源教授领导的「赛马会未来先进计算技术创科实验室」对刚刚召开的ISCA会议进行了全面总结,涵盖历史发展和技术细节,总结出了体系结构领域有潜力的研究方向!
我们大部分情况下并发任务都是交由线程池统一管理,所以对于线程池的关闭就涉及任务的终止和资源兜底,所以本文将针对线程池优雅关闭这一话题展开探讨。
如果你还在困惑为什么有的 AI 能无缝调用企业数据,有的能在边缘设备上协同工作,有的却能跨平台完成复杂任务 —— 答案就在这三个关键协议里:MCP、ACP 和 A2A。