AI 精选工程笔记

技术摘要

AI 精选与摘要技术文章、编程实践和人工智能新闻。

---

让 AI Agent 安全地花钱:Amazon Bedrock AgentCore Payments 的防护机制

来源: aws.amazon.com 19
让一个 AI Agent 帮你下单付款,听起来很方便——直到它花错了钱。Agent 自主调用支付接口的那一刻,风险就从"对话幻觉"升级成了"真实损失"。Amazon Bedrock AgentCore Payments 正是为了解决这个问题而生:在 Agent 和支付动作之间插入一层内置的防护栏(guardrails),让 agentic paymen...

AI 公司如何表态:政策立场、安全承诺与独立性边界

来源: openai.com 32
AI 行业正从"只管做模型"的阶段迈入"必须回答社会问题"的阶段。监管草案密集出台,政治团体试图借 AI 之名发声,公众对透明度的要求越来越高——一家 AI 公司到底该在政策上站什么位置?Anthropic 最近公开了自己的答案:支持审慎监管、坚持 AI 安全优先、明确声明任何外部政治团体不代表公司立场。这份表态本身就是一个值得拆解的信号。 Anthr...

Claude Code 动态工作流:让多个 Agent 并行拆解复杂工程任务

来源: infoq.com 34
Anthropic 给 Claude Code 加了一个值得注意的能力——Dynamic Workflows。过去让 AI Agent 处理大型工程任务,最大的瓶颈不是单个 Agent 的智力,而是协调:任务怎么拆、拆完怎么跑、跑完怎么验。Dynamic Workflows 直接把这三步串成了一条自动化链路,Claude 不再只是"回答问题",而是自己...

固件更新后服务器重启四小时?深挖 UEFI 与 iPXE 把启动时间压到分钟级

来源: blog.cloudflare.com 34
一次常规固件更新,核心服务器重启竟然要等四个小时。这不是夸张——当数百台节点同时上线,每台都在 UEFI 阶段白白等待,累计的停机时间足以让运维团队崩溃。本文拆解一次真实排查:从定位 UEFI 数据结构中的隐藏超时,到用 iPXE 自动化跳过无用的等待步骤,最终把启动时间从小时级拉回分钟级。 服务器重启慢,直觉会怀疑 OS 层面的服务启动。但这次问题出...

Lite API:用 XML 声明接口,把 Java CRUD 的模板代码砍掉大半

来源: oschina.net 34
写一个最简单的查询接口,你要建多少文件?Controller、Service、ServiceImpl、Mapper、Entity、DTO、VO……还没写一行业务逻辑,项目结构已经铺了八层。Swagger 注解再补一圈,半天过去了。真正决定接口行为的代码,可能就三五行。 Lite API 换了个思路:用 XML 声明接口行为,JFinal 做底层执行,把...

给 Cognito 加一层可扩展的用户搜索

来源: aws.amazon.com 32
Amazon Cognito 解决了认证和用户池管理的问题,但它的搜索能力非常有限——只能按用户名、邮箱、子 ID 等少数字段做精确匹配,不支持模糊搜索、组合条件筛选或全文检索。当你的应用需要"按姓名拼音搜用户""按注册时间范围+角色标签过滤"这类需求时,Cognito 自身的 ListUsers API 会很快成为瓶颈。 解决方案的思路很直接:把 C...

AgentOps:让 AI Agent 在生产环境真正可控

来源: aws.amazon.com 21
Agent 不再只是按脚本跑的流水线——它会推理、会变道、会自己拍板。这意味着传统 DevOps 的监控、回滚、成本管控手段,在 Agent 场景下几乎全部失效。一次"聪明"的自主决策,可能让调用链多绕三圈,Token 费用翻十倍,而日志里只留下一句模糊的 。 Amazon 在 Bedrock AgentCore 上提出了一套 AgentOps 纪律:...

用 GPUDirect + FSx for Lustre 加速百亿参数 LLM 加载,TurboQuant 扩展上下文窗口

来源: aws.amazon.com 27
当你把一个 70B 甚至 175B 参数的大模型往 GPU HBM 里塞的时候,等待时间会随参数量线性膨胀——几百 GB 的权重文件先从存储读到 CPU 内存,再从 CPU 内存拷贝到 GPU,整个过程 GPU 干等着,推理启动慢、资源浪费大。AWS 近期把 GPUDirect Storage(GDS)与 Amazon FSx for Lustre 打...

用 MCP 让时序数据库开口说话:Amazon QuickSight + KDB-X 实战

来源: aws.amazon.com 16
时序数据从来都不缺——金融行情、IoT 传感器、DevOps 指标,每秒都在涌入。缺的是让业务人员自己拿到答案的能力。分析师想问"过去 24 小时这只股票的波动率是多少",要么等数据团队排期写 SQL/Q 查询,要么在仪表盘里翻半天。Amazon QuickSight 搭上 KDB-X 的 MCP Server,把这条链路压成一句话:用自然语言提问,直...

沙箱安全:隔离边界之外的策略与 enforcement

来源: docker.com 32
40% 的受访企业把安全列为规模化 Agentic AI 的头号难题——这不是因为大家不懂"隔离",而是因为光有隔离远远不够。沙箱把进程关起来,沙箱安全则要确保这扇门在真实压力下不会被撞开、被绕过、被悄悄撬开。两者之间的差距,正是生产环境事故的常见起点。 传统沙箱解决的是"空间隔离":进程 A 看不到进程 B 的文件,容器 C 不能访问宿主机网络。实现...