标签

CNCF

在 Kubernetes 上把 LLM 冷启动压到 30 秒——网易游戏的实战路径

来源:cncf.io 31
弹性扩容听起来很美:流量来了就加 Pod,流量走了就缩容。但把这套逻辑搬到 LLM 推理服务上,现实会给你一记闷棍——模型权重动辄几十 GB,Pod 从零到可用,数据搬运的时间远比计算调度慢。网易游戏在生产环境中把这个冷启动过程压到了 30 秒,核心认知只有一句:弹性计算只有在数据能同等速度移动时才有意义。 一个典型 LLM 推理 Pod 的冷启动链路...

Prempti:给 AI 编程代理套上缰绳

来源:cncf.io 27
AI 编程代理已经不再是实验玩具。Claude Code 坐在你的终端里,读文件、跑命令、发网络请求、写代码——全是以你的名义。便利是真实的,风险也是真实的:一个没有约束的代理可以误删生产配置、把密钥推到公开仓库、或者执行一条你根本没打算运行的 shell 命令。Prempti 的切入点很直接——策略(Policy)与可见性(Visibility),让...

用 Kyverno 自动化 Confidential Containers 基础设施,让应用团队不再操心底层细节

来源:cncf.io 29
Confidential Containers(CoCo)为容器工作负载提供了一层关键的安全隔离——即使在平台部分不可信的环境下,也能通过硬件可信执行环境(如 AMD SEV-SNP、Intel TDX)保护运行中的数据。但现实是:要让一个普通 Pod 跑在 CoCo 环境里,应用团队往往需要手动指定 、添加节点选择器、配置加密参数等一堆基础设施细节。...

医疗巨头 CVS Health 加入 CNCF 白金会员:云原生在强监管行业的信号

来源:cncf.io 27
2026 年 5 月,CNCF 宣布 CVS Health 成为白金会员。这不是一家互联网公司追加预算,而是美国最大医疗健康企业之一把云原生写进了基础设施战略的核心位置。信号很明确:云原生不再只是"技术圈的事",它正在进入对安全、合规、稳定性要求最苛刻的行业。 CNCF 的会员等级从 End User 到 Platinum,白金是最高档。拿到这个席位的...

kubectl debug 的证据黑洞:调试结束,现场消失

来源:cncf.io 21
一次 会话可能是你唯一能直接观察故障现场的机会。但当你退出终端的那一刻,Kubernetes 不会保留任何会话上下文——进程列表、环境变量、网络连接、临时文件,全部随容器销毁而蒸发。这不是小问题,而是生产环境排障中的系统性证据缺口。 在目标 Pod 中注入一个 ephemeral container(临时容器)。这个容器和目标容器共享 PID name...

用 Rust 扩展 AI 网关:agentgateway 与 kgateway 的自定义转换实践

来源:cncf.io 26
AI 网关正在成为大模型应用的基础设施层——认证、限流、路由、Prompt 防护,这些内置策略覆盖了大多数场景。但当你需要给请求注入业务上下文、对响应做字段裁剪、或者把多个模型的输出合并成统一格式时,内置策略就不够用了。agentgateway 和 kgateway 的做法是:把扩展点交给 Rust,让你用代码而不是 YAML 声明来定义转换逻辑。 典...

AI Agent 当贡献者:KubeStellar 81% PR 接受率背后的工程实践

来源:cncf.io 19
去年 12 月中旬,KubeStellar Console 从零开始搭建——这是一个面向 Kubernetes 多集群管理的仪表盘项目,托管在 CNCF Sandbox 里的 KubeStellar 之下,后端用 Go 写。项目起步阶段人手有限,却要在短时间内交付可用的控制面。团队做了一个大胆的决定:让 AI Agent 不只是"辅助工具",而是直接以...

KubeCon + CloudNativeCon Japan 2026:横滨再聚,云原生与 AI 的交汇点

来源:cncf.io 32
2026 年 5 月 13 日,CNCF 正式公布了第二届日本站 KubeCon + CloudNativeCon 的日程安排。去年首届日本站已经证明了亚太区云原生社区的活跃度,今年移师横滨,议题重心明显向 AI 融合、可观测性、平台工程三个方向倾斜——这三个方向恰好也是一线团队正在落地或纠结的技术选型焦点。 今年日程中最突出的变化是 AI 相关 se...

从 FluxCD 到全栈云原生:用 Kairos、k0rdent 和 bindy 搭建不可变基础设施平台

来源:cncf.io 15
RBC Capital Markets 的 Kubernetes 平台演进走了一条很务实的路线:先用 FluxCD 把 GitOps 的底座打牢,再逐步向上解决更硬的问题——节点操作系统不可变性、多集群生命周期管理、跨集群网络连通。Kairos、k0rdent 和 bindy 这三个项目分别对应这三层需求,组合起来构成了一套从裸金属到应用交付的完整链路...

Cloud Custodian 十年:从云治理 DSL 到 AI Agent 时代的护栏

来源:cncf.io 27
云环境治理这件事,多数团队的做法是写脚本、跑巡检、手动整改——然后脚本散落各处,没人记得哪个还在跑。Cloud Custodian 用一种截然不同的方式解决这个问题:把治理逻辑写成声明式 YAML 策略,引擎无状态执行,一套 DSL 覆盖公有云、Kubernetes 和 IaC。项目进入 CNCF 孵化,走过十年,现在又面对一个新命题——当 AI Ag...