分类

文章

平台团队如何通过改善开发者体验推动合规落地

2026-07-23 来源: infoq.com 32

平台工程团队承担合规治理时，很容易把目标理解成“让所有团队立即遵守统一流程”。但如果新流程依赖强制入口、文档不完整，并且没有解释规则解决了什么风险，开发者感受到的通常不是治理能力，而是交付阻力。更有效的做法，是把合规设计成平台能力：简化规则，优先控制真正重要的风险，再通过预防、检测和沟通逐步推广。开发者不需要成为合规专家，也能在日常交付路径中做出正确...

# Go # InfoQ # 全栈

阅读全文

Kubeflow 任务正常，GPU 却闲置 60%：从 NCCL 到 Cilium 的排障路径

2026-07-23 来源: cncf.io 34

分布式训练最难排查的故障，往往不是 Pod 崩溃，而是所有组件看起来都正常：Kubeflow 任务处于 Running，Pod 没有重启，也没有 OOMKill，但 GPU 大部分时间没有计算。来源摘要描述的正是这种反直觉现象：训练任务健康运行，GPU 却有约 60% 的时间处于空闲状态。这类问题不能只看 Kubernetes 控制面。分布式训练依赖...

# AI # CNCF # Kubernetes

阅读全文

QCon AI New York 2026 开放报名：生产级 AI 议题正在从模型能力转向工程系统

2026-07-23 来源: infoq.com 15

QCon AI New York 2026 已开放报名，会议将于 12 月 15 至 16 日在 The Westin Jersey City Newport 举办。活动聚焦生产级 AI，设置六条技术轨道，由 Eder Ignatowicz 担任主席，Faye Zhang 与 Wes Reisz 共同参与组织。首批演讲计划于 8 月公布，完整议程预计在...

# AI # InfoQ # 全栈

阅读全文

CrateDB 6.4.1 发布：面向机器数据的分布式 SQL 数据库维护更新

2026-07-23 来源: oschina.net 18

CrateDB 6.4.1 已正式发布。这是一次以修复为重点的维护版本。对正在使用 CrateDB 承载日志、指标、设备遥测和工业时序数据的团队来说，维护版本的价值通常不在新语法，而在于降低生产环境中的不确定性，并为后续升级提供更稳定的基线。 CrateDB 的定位不是传统单机关系数据库的简单扩容版。它把分布式存储、分片和并行查询封装在 SQL 接口后...

# 全栈 # 开源 # 开源中国

阅读全文

Bijou64：用唯一编码让变长整数解析更安全

2026-07-23 来源: infoq.com 18

变长整数编码很省空间，却容易把“同一个数字的多种字节表示”带进安全边界。Ink & Switch 发布的 bijou64，目标就是让每个数字只有一种字节表示，从编码层面消除 canonicality bug 这一类问题。类似缺陷曾出现在 PKCS#1、JWT 库和 Bitcoin 相关实现中；摘要还显示，bijou64 的解码速度约为 LEB1...

# Go # InfoQ # Java

阅读全文

qKnow 开源版 v2.3.0：用 Skills 把提示词沉淀为可复用的 Agent 能力

2026-07-23 来源: oschina.net 34

qKnow 智能体构建平台开源版 v2.3.0 新增了 Skills 模块。它解决的是 Agent 构建过程中一个很实际的问题：提示词、任务指令和操作经验往往散落在个人文档或聊天记录里，能不能把它们整理成可管理、可复用、可组合的能力单元？这次升级支持 Skills 的创建、导入、修改、预览、下载，以及启用和停用管理；在 Agent 编排页面中，还可以...

# AI # LLM # 全栈

阅读全文

qData 专业版 V2.5.0：把数据开发从分散操作串成一条工作流

2026-07-23 来源: oschina.net 14

qData 数据中台专业版 V2.5.0 的重点，不只是增加几个功能入口，而是重新整理数据研发过程：重构数据开发 IDE 工作台，新增独立数据血缘能力，增强多类型 SQL 血缘解析，扩大整库同步范围，同时补强数据集成运维、数据连接和任务运行前校验。对数据开发人员来说，这些变化指向同一个问题：一条任务从找到数据、编写 SQL，到发布、运行、排错和评估影...

# 全栈 # 开源 # 开源中国

阅读全文

让 RAG 不再答旧 API：从分块、向量检索到 HNSW 多路召回

2026-07-23 来源: my.oschina.net 27

大模型不知道你的代码库刚刚升级，也不知道内部优惠券退款流程写在哪份文档里。没有外部上下文时，它会用训练阶段见过的模式补全答案，于是可能给出 v1.x 的旧 API，或为内部流程编造看似合理的步骤。RAG（Retrieval-Augmented Generation，检索增强生成）的工作，是在生成前先从可信资料中找出相关证据，再把证据交给模型回答。但 ...

# AI # LLM # 全栈

阅读全文

qData v1.6.0 接入 DataX 与 Quartz：数据同步不再绑定重型调度栈

2026-07-23 来源: oschina.net 30

qData 开源版 v1.6.0 的重点不只是新增两个组件，而是改变了数据任务的部署入口：系统内置 Quartz 调度器与 DataX 数据集成执行引擎，同时保留 DolphinScheduler 和 Spark 的完整运行模式。对于只需要定时同步几张业务表、尚未建设大数据基础设施的团队，这意味着可以先用更少的依赖跑起来；对于已有成熟调度和计算平台的团...

# 全栈 # 开源 # 开源中国

阅读全文

开放社区正在把 Kubernetes 变成 AI 的通用运行底座

2026-07-23 来源: cncf.io 19

AI 基础设施正在从少数团队维护的专用平台，转向由开放社区共同定义的通用运行环境。CNCF 2025 年度云原生调查显示，82% 的容器用户已经在生产环境运行 Kubernetes；在托管生成式 AI 的组织中，66% 使用 Kubernetes。对工程团队而言，这意味着模型服务、GPU 调度、扩缩容和可观测性正逐渐进入同一套云原生控制面。把 Kub...

# AI # CNCF # Kubernetes

阅读全文