2026-05-14
来源:oschina.net
18
2010 年前后,整个行业达成了一个共识:计算无状态,状态归数据库。应用服务器随便加,负载均衡器随便转发,请求落到哪台机器都一样——因为真相只存在于数据库里。这套范式统治了二十年,Kubernetes、微服务、Serverless 全是它的产物。 但当你把一个 LLM 接进系统,这根支柱开始晃了。 云原生的核心等式很简单: 想扩容?垂直升级数据库(换更...
2026-05-14
来源:kubernetes.io
29
AI/ML 训练和批处理任务有一个共同诉求:要么所有 Pod 同时跑起来,要么谁也别跑。Kubernetes 一直按 Pod 逐个调度,遇到这种"全有或全无"的场景就容易卡死——3 个 Pod 占了资源,第 4 个没位置,前 3 个白占着等,别人也用不上。v1.35 引入了 Workload API 和初步的 gang scheduling,但把运行状...
2026 年 5 月 13 日,CNCF 正式公布了第二届日本站 KubeCon + CloudNativeCon 的日程安排。去年首届日本站已经证明了亚太区云原生社区的活跃度,今年移师横滨,议题重心明显向 AI 融合、可观测性、平台工程三个方向倾斜——这三个方向恰好也是一线团队正在落地或纠结的技术选型焦点。 今年日程中最突出的变化是 AI 相关 se...
RBC Capital Markets 的 Kubernetes 平台演进走了一条很务实的路线:先用 FluxCD 把 GitOps 的底座打牢,再逐步向上解决更硬的问题——节点操作系统不可变性、多集群生命周期管理、跨集群网络连通。Kairos、k0rdent 和 bindy 这三个项目分别对应这三层需求,组合起来构成了一套从裸金属到应用交付的完整链路...
2026-05-13
来源:docker.com
22
4 月 15 日,NIST 宣布对国家漏洞数据库(NVD)采用"优先富化"模型:绝大多数 CVE 仍会发布,但只有部分会获得 CVSS 评分、CPE 匹配和 CWE 分类。换句话说——漏洞条目还在,但你最依赖的那几列数据,开始大面积留空了。 这并非突发变故。任何长期拉取 NVD 数据的人早就注意到评分延迟和字段缺失在逐年恶化,NIST 只是把既有趋势正...
2026-05-13
来源:kubernetes.io
23
CPU 利用率 80%,看起来还有余量——但调度延迟已经让关键 Pod 的请求排队数百毫秒。这种"利用率正常、实际已经卡死"的盲区,在 Kubernetes 里长期存在。v1.36 中 PSI(Pressure Stall Information)指标从 Beta 晋升 GA,意味着你终于有一个稳定接口,直接观测节点、Pod、容器三个层面的资源阻塞,而...
2026-05-13
来源:docker.com
21
AI Agent 正在成为开发者日常中最强的生产力杠杆——但问题也随之浮现:一个能读写文件、调用 API、访问数据库的 Agent,跑在你的笔记本上,本质上已经拥有了"生产级"的权限。如果你的团队里每个人都在本地跑 Agent,谁来保证它们不会误删数据库、不会把密钥泄露到外部网络、不会调用不该调用的 MCP 工具? Docker 的回答是:把笔记本当作...
云环境治理这件事,多数团队的做法是写脚本、跑巡检、手动整改——然后脚本散落各处,没人记得哪个还在跑。Cloud Custodian 用一种截然不同的方式解决这个问题:把治理逻辑写成声明式 YAML 策略,引擎无状态执行,一套 DSL 覆盖公有云、Kubernetes 和 IaC。项目进入 CNCF 孵化,走过十年,现在又面对一个新命题——当 AI Ag...
Kubernetes 每年发布约三个小版本,每个版本的支持周期大约一年。这意味着你要么跟上节奏定期升级,要么冒险运行一个不再接收安全补丁的集群。现实是,很多团队每次升级都要花数周甚至数月——读 changelog、排查 API 废弃、逐个节点滚动、验证工作负载……升级本身成了工程时间的黑洞。 问题不在于 Kubernetes 太复杂,而在于我们把升级当...