标签

LLM

Metis:Arm 开源的 AI 安全框架,用语义推理替代传统 SAST 扫描

来源:infoq.com 17
传统 SAST 工具的核心逻辑是"匹配模式"——拿一套规则库逐行比对源码,命中就报漏洞。这套方法对硬编码密码、SQL 拼接这类局部缺陷还算管用,但面对跨组件的数据流污染、条件分支间的逻辑矛盾,基本只能输出一堆低信噪比的告警,然后靠人工逐条甄别。Arm 刚刚开源的 Metis 换了一条路:让 AI Agent 自主阅读代码、理解语义、追踪跨模块依赖,再用...

Arm 开源 Metis:用 Agent 语义推理挖漏洞,传统 SAST 该换思路了

来源:infoq.com 35
静态分析工具(SAST)跑完一轮,报告里堆满了低优先级的警告,真正危险的跨组件漏洞却漏掉了——这不是个别团队的体验,而是规则匹配式工具的结构性短板。Arm 最近开源了 Metis,一个基于 Agent 的 AI 安全框架,试图用语义推理替代模式匹配,自主发现复杂漏洞并给出自然语言解释。 主流 SAST 工具的核心逻辑是规则匹配:扫描源码,命中预定义的模...

给 SageMaker AI 上的大模型推理装上"全息仪表盘"——从 GPU 利用率到生成质量一站式可观测

来源:aws.amazon.com 25
大模型上线推理后,运维团队最怕的不是"模型不跑",而是"模型跑着但悄悄变差"。传统监控只盯着 GPU 利用率、请求延迟这些基础设施指标,对 LLM 输出质量——延迟首字时间(TTFT)、吞吐量(Tokens/s)、输出截断率——几乎一无所知。Amazon SageMaker AI 的 Inference Component 架构配合 CloudWatc...

Claude Opus 4.8 登陆 Microsoft Foundry:最强 Opus 模型现在可以直接在 Azure 上调用

来源:techcommunity.microsoft.com 29
Anthropic 的旗舰模型 Claude Opus 4.8 正式上线 Microsoft Foundry(Azure AI Foundry)。对于已经在 Azure 上构建应用的企业和开发者来说,这意味着不再需要额外对接 Anthropic 的独立 API——直接在现有的 Azure 资源体系内就能调用 Opus 级别的推理能力,覆盖代码生成、智能...

AI 辅助罕见病诊断:波士顿儿童医院用 OpenAI 技术突破诊断瓶颈

来源:openai.com 31
罕见病的诊断平均耗时 5-7 年,患者往往辗转多家医院、经历数十次误诊。波士顿儿童医院近期披露:借助 OpenAI 技术,他们已成功辅助诊断超过 40 例罕见病,同时减轻了临床团队的运营负担。这不是一个"AI 替代医生"的故事,而是一个"AI 把人类专家从信息沼泽里拉出来"的工程实践。 罕见病单病种发病率极低,但总数超过 7000 种,累及全球约 3 ...

用 Codex 把客户需求直接变成代码:Braintrust 的工程实践

来源:openai.com 19
客户提了一个需求,工程师打开 IDE,从零开始写代码——这条路径在 AI 时代正在被压缩。Braintrust 团队最近分享了他们如何用 OpenAI 的 Codex 配合 GPT-5.5,把客户请求快速转化为可运行的代码,并在自己的评估平台上完成实验闭环。 这不是"AI 写代码然后人盲审"的粗糙流程,而是把 Codex 嵌进需求→代码→验证的完整链路...

GitHub 把 Agent CI 工作流的 Token 开销砍了 62%——三板斧拆解

来源:infoq.com 28
Agent 工作流跑 CI,模型调用一多,Token 费用就悄悄失控。GitHub 工程团队最近公开了一组数据:通过修剪 MCP 工具、用 CLI 替代部分 MCP 调用、再加上每天自动跑"审计员"和"优化员"两个 Agent,他们把 agentic CI 流程的 Token 消耗压降了最多 62%。不是靠换便宜模型,而是靠让每次调用更"有效"。 下面...

GitHub 把 Agent CI 工作流的 Token 开销砍掉 62%——裁 MCP、换 CLI、日审计

来源:infoq.com 14
Agent 跑 CI,Token 烧得比服务器还贵,这不是段子而是不少团队的日常。GitHub 最近公开了一组数据:通过裁剪无用 MCP 工具、把部分 MCP 调用换成 CLI、再配上每天自动跑的审计与优化 Agent,他们的 agentic CI 工作流 Token 开销最高降了 62%。做法并不玄学,拆开看每一步都是工程决策。 MCP(Model ...

QEMU 对 AI 生成内容开了一扇门:非关键领域可接纳 LLM 贡献

来源:oschina.net 21
去年 QEMU 项目明确禁止任何包含或衍生自 AI 生成内容的贡献,态度堪称行业最硬。如今这道墙有了裂缝——红帽虚拟化工程师 Paolo Bonzini 在邮件列表发布补丁,提议将"全面禁止"改为"分区管理":非关键领域允许 AI/LLM 辅助产出,关键路径仍需人工把关。 这不是随意的妥协,而是对 LLM 能力边界重新评估后的务实调整。 QEMU 最初...