2026-05-31
来源:infoq.com
18
传统 SAST 工具的核心逻辑是"匹配模式"——拿一套规则库逐行比对源码,命中就报漏洞。这套方法对硬编码密码、SQL 拼接这类局部缺陷还算管用,但面对跨组件的数据流污染、条件分支间的逻辑矛盾,基本只能输出一堆低信噪比的告警,然后靠人工逐条甄别。Arm 刚刚开源的 Metis 换了一条路:让 AI Agent 自主阅读代码、理解语义、追踪跨模块依赖,再用...
2026-05-31
来源:infoq.com
36
静态分析工具(SAST)跑完一轮,报告里堆满了低优先级的警告,真正危险的跨组件漏洞却漏掉了——这不是个别团队的体验,而是规则匹配式工具的结构性短板。Arm 最近开源了 Metis,一个基于 Agent 的 AI 安全框架,试图用语义推理替代模式匹配,自主发现复杂漏洞并给出自然语言解释。 主流 SAST 工具的核心逻辑是规则匹配:扫描源码,命中预定义的模...
2026-05-30
来源:aws.amazon.com
26
大模型上线推理后,运维团队最怕的不是"模型不跑",而是"模型跑着但悄悄变差"。传统监控只盯着 GPU 利用率、请求延迟这些基础设施指标,对 LLM 输出质量——延迟首字时间(TTFT)、吞吐量(Tokens/s)、输出截断率——几乎一无所知。Amazon SageMaker AI 的 Inference Component 架构配合 CloudWatc...
2026-05-29
来源:techcommunity.microsoft.com
30
Anthropic 的旗舰模型 Claude Opus 4.8 正式上线 Microsoft Foundry(Azure AI Foundry)。对于已经在 Azure 上构建应用的企业和开发者来说,这意味着不再需要额外对接 Anthropic 的独立 API——直接在现有的 Azure 资源体系内就能调用 Opus 级别的推理能力,覆盖代码生成、智能...
2026-05-29
来源:openai.com
32
罕见病的诊断平均耗时 5-7 年,患者往往辗转多家医院、经历数十次误诊。波士顿儿童医院近期披露:借助 OpenAI 技术,他们已成功辅助诊断超过 40 例罕见病,同时减轻了临床团队的运营负担。这不是一个"AI 替代医生"的故事,而是一个"AI 把人类专家从信息沼泽里拉出来"的工程实践。 罕见病单病种发病率极低,但总数超过 7000 种,累及全球约 3 ...
2026-05-29
来源:openai.com
20
客户提了一个需求,工程师打开 IDE,从零开始写代码——这条路径在 AI 时代正在被压缩。Braintrust 团队最近分享了他们如何用 OpenAI 的 Codex 配合 GPT-5.5,把客户请求快速转化为可运行的代码,并在自己的评估平台上完成实验闭环。 这不是"AI 写代码然后人盲审"的粗糙流程,而是把 Codex 嵌进需求→代码→验证的完整链路...
2026-05-29
来源:infoq.com
29
Agent 工作流跑 CI,模型调用一多,Token 费用就悄悄失控。GitHub 工程团队最近公开了一组数据:通过修剪 MCP 工具、用 CLI 替代部分 MCP 调用、再加上每天自动跑"审计员"和"优化员"两个 Agent,他们把 agentic CI 流程的 Token 消耗压降了最多 62%。不是靠换便宜模型,而是靠让每次调用更"有效"。 下面...
2026-05-29
来源:infoq.com
15
Agent 跑 CI,Token 烧得比服务器还贵,这不是段子而是不少团队的日常。GitHub 最近公开了一组数据:通过裁剪无用 MCP 工具、把部分 MCP 调用换成 CLI、再配上每天自动跑的审计与优化 Agent,他们的 agentic CI 工作流 Token 开销最高降了 62%。做法并不玄学,拆开看每一步都是工程决策。 MCP(Model ...
2026-05-29
来源:oschina.net
18
一个维护者,在自己的库里偷偷塞了一段专门针对 AI Agent 的攻击指令——不是黑客干的,是作者本人。这件事发生在 Java 属性测试圈子里颇有名气的 jqwik 库上,版本号 1.10.0。 jqwik 是 Java 生态中用于属性测试(Property-Based Testing)的主流库,和 Kotlin 的 kotest、Scala 的 sc...
2026-05-29
来源:oschina.net
22
去年 QEMU 项目明确禁止任何包含或衍生自 AI 生成内容的贡献,态度堪称行业最硬。如今这道墙有了裂缝——红帽虚拟化工程师 Paolo Bonzini 在邮件列表发布补丁,提议将"全面禁止"改为"分区管理":非关键领域允许 AI/LLM 辅助产出,关键路径仍需人工把关。 这不是随意的妥协,而是对 LLM 能力边界重新评估后的务实调整。 QEMU 最初...