标签

LLM

在 GKE 上构建企业级 AI 安全防线：从机密计算到推理路径治理

2026-07-16 来源: cloud.google.com 39

AI 应用从原型进入生产的速度，已经超过许多企业安全体系的调整速度。传统容器安全可以检查镜像漏洞、限制网络访问，却无法完整回答这些新问题：模型权重是否在硬件层受到保护？提示词注入能否在进入模型前被识别？Agent 执行生成代码时，怎样避免影响宿主节点？ GKE 的 AI 工作负载安全蓝图给出的答案不是单一产品，而是一套纵深防御体系：基础设施层保护计算环...

# AI # GCP # Go

阅读全文

在 Kubernetes 中用 vLLM 部署自托管大模型：从 GPU 调度到服务验证

2026-07-16 来源: cncf.io 28

托管模型 API 仍然是许多业务的合适选择：接入快、运维负担低，也容易按调用量扩展。自托管并不是要取代它，而是提供另一种部署路径。当团队需要控制模型版本、数据流向、推理配置或基础设施成本时，可以考虑在 Kubernetes 中运行 vLLM，把 GPU 推理服务纳入现有的调度、发布和监控体系。调用托管 API 时，团队主要管理请求、密钥、配额和业务降...

# AI # CNCF # Kubernetes

阅读全文

当 AI Agent 花钱快过账单告警：云凭证与成本护栏必须前移

2026-07-16 来源: infoq.com 34

云成本治理过去主要防范人的误操作：工程师开错实例、忘记关闭测试环境，账单告警晚几个小时通常还有补救空间。但当携带云凭证的 AI Agent 能连续调用模型、创建资源并自动重试时，支出速度已经超过传统账单系统的反馈速度。来源案例中，一家三人规模的代理机构因静态 AWS Access Key 被攻击者提取，一天内产生了 14,000 美元的 Amazon...

# AI # AWS # InfoQ

阅读全文

当 AI Agent 花钱比账单告警更快：云凭证与成本护栏如何重构

2026-07-16 来源: infoq.com 25

云成本控制过去主要防范人的误操作：工程师开错实例、忘记关闭测试环境，账单告警通常还有时间介入。但当持有云凭证的是 AI Agent 或攻击者时，资源调用可以在几分钟内并发放大，而成本数据和预算通知可能要到数小时甚至约一天后才反映出来。一支三人团队在静态 AWS Access Key 被提取后，一天内收到了 14,000 美元账单，攻击者主要消耗了 A...

# AI # AWS # InfoQ

阅读全文

两天重构两万行 Vue：真正驱动 AI 编码的是约束系统

2026-07-16 来源: my.oschina.net 23

让 AI 在两天内参与重构两万行 Vue 项目，真正值得关注的并不是“0 行手写代码”，而是如何让生成代码变得可控。核心方法可以概括为三层：用 Skills 注入领域知识，用固化项目规则，再把评审中发现的问题写回约束，让同类错误只出现一次。这套思路把 AI 从临时问答工具变成了受项目规范约束的执行者。速度来自模型，稳定性则来自人建立的工程系统。一...

# AI # LLM # Vue

阅读全文

Coding Agent 集体进入 deepin 应用商店：Linux 开发工具开始走向统一交付

2026-07-16 来源: oschina.net 30

多款主流 Coding Agent 登陆 deepin 应用商店，真正值得关注的不只是“又多了几个 AI 工具”，而是它们开始通过 Linux 桌面用户熟悉的渠道完成分发。开发者不必再分别寻找安装包、核对下载来源和跟踪更新，Coding Agent 正从需要手工拼装的前沿工具，转变为可以统一安装和管理的日常开发软件。 Coding Agent 的迭代速...

# AI # LLM # 全栈

阅读全文

别让 Coding Agent 重修旧 Bug：把本地会话变成可搜索的工程记忆

2026-07-16 来源: oschina.net 28

Claude Code、Codex、opencode 之类的 Coding Agent 会持续把会话写入本地：有的是 JSONL，有的是 session 文件，也有工具使用 SQLite。项目一多，这些记录很容易膨胀到 GB 级。真正浪费的不是磁盘，而是其中已经验证过的排障过程无法被再次检索：同一个构建错误、代理配置或数据库边界条件，几周后又要从头调查...

# AI # LLM # 全栈

阅读全文

收购 Kilo Code 之后，Anaconda 想把企业 AI 编程纳入治理边界

2026-07-16 来源: oschina.net 36

开发者采用 AI 编程工具已经不是一个需要预测的趋势，而是正在发生的工作方式变化。Anaconda 于 7 月 15 日宣布收购 AI 工程 Agent 平台 Kilo Code。后者服务超过 300 万开发者，每月编排近 10 万亿 token。把这组规模数据和 Kilo Code CEO Scott Breitenother 的判断放在一起，收购逻...

# AI # LLM # 全栈

阅读全文

pg_hardstorage：用复制协议、内容寻址存储和开放格式重做 PostgreSQL 备份

2026-07-16 来源: postgr.es 24

PostgreSQL 备份工具并不少：pgBackRest、Barman 和 WAL-G 已经支撑了大量生产系统。pg_hardstorage 的出发点不是替代这些成熟项目，而是增加一个可以审计、可以迁移、适合云原生部署的开源选项。它选择 PostgreSQL 复制协议作为数据平面，通过普通 libpq 连接持续接收 WAL，因此同一套架构可以面对托管...

# AI # AWS # Azure

阅读全文

AI 进入 Linux 内核评审：可以质疑工具，但不能用立场替代技术判断

2026-07-16 来源: oschina.net 21

Linux 内核邮件列表这次争论的不是缩进、驱动接口或补丁拆分，而是 AI 能不能进入开发流程。随着 Sashiko 这样的 AI 代码审查系统逐渐活跃，加上软件自由保护协会（SFC）发布 AI 使用建议，一部分开发者公开表达抵触。Linus Torvalds 的回应把问题重新拉回工程判断：开发者可以不喜欢 AI，也可以拒绝自己使用，但不能仅凭立场阻止...

# AI # LLM # 全栈

阅读全文