🔥51CTO热榜:2025-07-18

该研究团队发现,被广泛用于评估人工智能答案质量的大语言模型,存在着令人惊讶的系统性漏洞。这些被称为“AI裁判”的系统,本应通过比较模型生成的答案与标准答案来给出评分,但它们却能被轻易地欺骗。
​这篇论文就是深度学习领域无人不晓的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。它的出现,从根本上改变了研究者们训练深度神经网络的方式,成为AI技术发展进程中的一座关键里程碑。​
如今,随着 Web API 的不断发展,一个强大的原生工具已经悄然来到了我们身边——MediaRecorder API。
在人工智能快速演进的今天,智能的形态呈现出多元分化的态势。其中,具身智能与离身智能代表了两种不同的研究方向与理念,理解这两种智能形态的区别,不仅有助于我们把握人工智能的发展脉络,更能为探索通用智能的实现路径提供重要启示。​
在云优先、混合办公的环境中,用户和数据既存在于传统边界内,也存在于传统边界外,仅依赖边界安全会使企业极易受到横向移动攻击、勒索软件攻击和数据泄露的威胁,企业需要采用零信任策略,即无论位置如何,都永不信任、始终验证。
AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
logstash是一个开源的数据采集工具,通过数据源采集数据.然后进行过滤,并自定义格式输出到目的地。
今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的开源 AI Agent 工作流引擎 - Sim Studio。
10:05  51CTO  使用Python操作Neo4j
本文通过使用python,带你看如何操作neo4j。
开源CLI工具在开发者和AI社区中已引起极大的轰动。随着Claude的Codex CLI、OpenAI的Codex CLI以及最近谷歌的Gemini CLI陆续发布,人们对CLI的兴趣骤然高涨。这些工具将AI支持融入到日常任务中,正在改变开发者使用终端的方式。
本指南将为你介绍构建AI应用程序的七大核心工具,它们能简化从数据准备、智能逻辑构建到语言模型集成、部署及用户界面设计的全流程。无论你是打造快速原型,还是开发可投入生产的应用,了解这些工具及其适用场景都将起到至关重要的作用。
OpenAI 宣布将在 ChatGPT 中推出一款通用型 AI 智能体,该公司表示该智能体可以帮助用户完成各种基于计算机的任务。
由于遗留系统管理传统上是一个缓慢而繁琐的过程,智能体有望在帮助企业最大化利用现有遗留IT资产价值的同时,避免给IT团队带来过重负担方面发挥关键作用。
没有高质量的数据“原油”,大模型只能生成“工业废水”,而重生的数据中台正悄然成为AI时代最关键的输油管道。
这期访谈里面有很多值得反复讨论的细节,Ryo 他的视角讨论了 Cursor 是什么,AI 产的设计原则,新一代创作者的设计方式等话题。我们团队做了精编翻译。
这种高级攻击手法利用了互联网通信中对DNS流量的基础信任——由于DNS在互联网中的核心作用,企业防火墙通常对其仅进行最低限度的检查。
本文将深入探讨十个适合初学者的sed单行命令,通过这些命令,你将能够直接从终端高效地搜索、替换和操作文本,大幅提升工作效率。
历经30年,九位天才数学家终于攻克了「几何朗兰兹猜想」!五篇近千页重磅论文,彻底为这一猜想画上句号,更为未来数学研究打开了一扇全新的大门。令人振奋的是,清华学者陈麟也是论文的重要作者。
迄今为止最强大的开源定理证明器登场!Goedel-Prover-V2仅用8B参数击败671B的DeepSeek-Prover,并再次夺下数学PutnamBench冠军。十位核心贡献者,八大顶尖机构,让AI形式化证明再破纪录。
首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令,全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力,研究结果发现当前主流大模型虽有一定能力,但整体水平仍不足以满足工程一线需求。