标签

云原生

HAMi 进入 CNCF 孵化阶段：GPU 共享与碎片治理走向云原生主航道

2026-07-16 来源: cncf.io 31

CNCF 技术监督委员会（TOC）已投票接纳 HAMi 成为 CNCF 孵化项目。对 AI 基础设施团队来说，这不仅是一次项目状态升级，也意味着一个长期存在的问题获得了更明确的云原生治理路径：昂贵的 GPU 虽然已经被 Kubernetes 纳管，却仍可能因为分配粒度过大、工作负载需求不均而产生资源碎片。传统 Kubernetes 调度通常把扩展资源...

# AI # CNCF # LLM

阅读全文

公开 Cloud Run 服务如何从一个输入漏洞演变为云项目失陷

2026-07-15 来源: cloud.google.com 40

公开的无服务器服务并不天然不安全，但它把自研代码、第三方依赖、运行时身份和云 API 放在了同一条攻击链上。一次目录遍历或命令注入，可能不只暴露容器内的文件，还会让攻击者借助服务账号权限访问 Secret Manager、Cloud Storage，甚至控制整个 Google Cloud 项目。真正有效的防护不能只依赖修复某一行代码。团队需要同时约束...

# AI # AWS # GCP

阅读全文

AWS 推出 Claude Apps Gateway：为 Claude Code 与 Desktop 建立自托管控制平面

2026-07-15 来源: infoq.com 35

AWS 与 Anthropic 发布了面向 AWS 的 Claude apps gateway。它把 Claude Code 和 Claude Desktop 的身份认证、策略、遥测、模型路由与费用上限集中到一个自托管控制平面中，并可将推理请求转发至 Amazon Bedrock 或 AWS 上的 Claude Platform。这项变化解决的不是“...

# AI # AWS # InfoQ

阅读全文

用 Claude Apps Gateway 在 AWS 上统一管理 Claude Code 与 Claude Desktop

2026-07-15 来源: infoq.com 28

AWS 与 Anthropic 发布了面向 AWS 的 Claude Apps Gateway。它不是新的大模型，而是部署在企业环境中的自托管控制平面：Claude Code 和 Claude Desktop 的请求先进入网关，再由网关统一处理身份、策略、遥测、路由与支出上限，并将推理请求转发到 Amazon Bedrock 或 AWS 上的 Clau...

# AI # AWS # InfoQ

阅读全文

2026 年本地 DBaaS：把数据库交付变成一套可治理的产品

2026-07-15 来源: cncf.io 39

对应用团队来说，数据库本应像一个已经解决的问题：提交 PostgreSQL、MariaDB 或 Redis 的申请，拿到连接凭据，然后开始开发。但在本地数据中心里，真正困难的往往不是启动数据库进程，而是把部署、备份、升级、权限、监控和容量管理组合成稳定的自助服务。到了 2026 年，建设本地 DBaaS 的关键问题已经不只是“选哪个数据库平台”，而是...

# CNCF # PostgreSQL # Redis

阅读全文

kkRepo v0.3.0：用开放的自托管制品仓库承接多语言供应链

2026-07-15 来源: oschina.net 28

kkRepo v0.3.0 将目标指向了一个明确的问题：当 Sonatype Nexus 社区版的限制开始影响团队工作流时，开发者需要一个完全开源、可以自托管并持续演进的制品仓库。kkRepo 目前覆盖 Maven、npm、PyPI、Go、Helm、Cargo/Rust、Dart/Pub、Docker/OCI、NuGet、RubyGems、Yum 和 ...

# Docker # Go # Rust

阅读全文

从 KeycloakCon Japan 2026 看云原生身份与 AI Agent 的安全边界

2026-07-15 来源: cncf.io 41

KubeCon + CloudNativeCon Japan 2026 举办前夕，KeycloakCon Japan 将于 7 月 28 日 09:00 至 12:30 在横滨举行。活动标题把两个正在快速交汇的方向放在了一起：云原生身份管理，以及 AI 带来的新型身份与授权问题。来源摘要没有披露具体议程和讲者，因此更值得提前梳理的是：开发团队应该带着哪...

# AI # CNCF # 云原生

阅读全文

从队列深度到自动扩缩容：为 Kubernetes 编写自定义指标 Exporter

2026-07-15 来源: kubernetes.io 42

Kubernetes 原生理解 CPU 和内存，但真实业务压力往往来自另一组信号：消息队列里积压了多少任务、最近一次批处理耗时多久、每个 Pod 维持了多少 WebSocket 连接。自定义指标 Exporter 的作用，就是把这些应用状态转换成 Prometheus 能抓取的时间序列，为查询、告警以及后续的 HPA 自动扩缩容提供数据基础。 Expo...

# AI # Docker # Go

阅读全文

把 Claude 跑进企业生产环境：Google Cloud 上的端点、安全与成本设计

2026-07-15 来源: cloud.google.com 20

把大模型接入原型只需要一次 API 调用，但把它稳定地服务给全球用户，还要处理算力调度、尾延迟、区域故障、数据驻留、访问控制和成本波动。Claude 在 Google Cloud Agent Platform 上以托管模型服务提供，把这些问题纳入企业已经使用的 IAM、VPC Service Controls、Cloud Logging 和 Cloud...

# AI # GCP # Go

阅读全文

Agent 的信任不在提示词里，而在运行时里

2026-07-14 来源: docker.com 27

AI Engineer World’s Fair 2026 的现场讨论指向一个很实际的判断：决定 Agent 能否进入生产环境的，不只是模型会不会规划和调用工具，更是运行时能否约束、观察并中止这些动作。提示词可以表达规则，但真正执行规则的地方必须是 Runtime。来源摘要没有展开具体演讲内容，因此下面不推断某家公司发布了什么产品，而是沿着“信任在运...

# AI # Docker # LLM

阅读全文