标签

云原生

BBS-GO 4.4:前后端架构统一、Docker 部署与 SEO 全面升级

来源:oschina.net 29
社区和问答平台 BBS-GO 刚发布 v4.4.0,这次不是功能堆叠,而是把底层技术栈和部署体验做了一次系统性翻新。如果你之前用过 BBS-GO 或者正在选型轻量级论坛方案,这个版本值得重新评估——前后端运行架构统一了,SPA 的构建和部署更顺滑,Docker 支持更强,SEO 也不再是短板。 BBS-GO 的后端一直用 Go 构建,4.4 版本对 G...

用 Cilium 打通多集群网络:Azure Kubernetes Fleet Manager 的跨集群通信方案

来源:azure.microsoft.com 17
管理多个 Kubernetes 集群时,最让人头疼的不是集群本身,而是集群之间的网络。服务跨集群调用、流量路由、安全策略——每一层都得自己搭桥。Azure Kubernetes Fleet Manager 现在引入了基于 Cilium 的跨集群网络,把这件事从"自己造路"变成了"直接上高速"。 多集群架构在大型组织中已经很常见:开发、预发布、生产各一套...

多租户 SaaS 平台的端到端入站请求链路追踪设计

来源:cncf.io 27
一个租户的请求从网关进入,经过鉴权、编排引擎、数据服务,最终落到下游第三方 API——中间跨越了十几条微服务调用。当这位租户反馈"响应变慢",你打开监控面板,看到的却是一堆散落在各服务日志里的碎片化 trace ID,根本拼不出一条完整链路。这就是大多数云原生 SaaS 平台在可观测性上的真实困境。 单租户系统里,一个 就能串联整条调用链。多租户平台引...

NVIDIA 把整个 GPU 函数计算平台开源了——NVCF 架构拆解与上手实践

来源:oschina.net 33
NVIDIA 做了一件不太寻常的事:把 build.nvidia.com 背后跑的整套函数计算平台——NVCF(NVIDIA Cloud Functions)——以 Apache 2.0 协议完整开源。不是 SDK,不是客户端库,不是"参考实现",而是控制平面、调用平面、计算平面、CLI、Helm charts、数据库迁移脚本,全部丢进一个单体仓库 。...

Cloudflare 用自建容器重写 Browser Run,拼完六层 Agent 基础设施

来源:infoq.com 19
Cloudflare 刚把 Browser Run 从第三方托管迁移到自家 Containers 平台上跑,并发能力翻了 4 倍、响应时间砍掉一半。这件事本身是个性能升级,但更值得注意的是——它把 Cloudflare 的 Agent 基础设施拼到了第六层,从计算到交易,一条链路全部收在边缘网络里。 Browser Run 是 Cloudflare 给...

Cloudflare 用自建容器重写 Browser Run,拼完六层 Agent 基础设施的最后一块

来源:infoq.com 17
Cloudflare 的 Browser Rendering 一直是开发者做网页抓取、自动化测试时的热门选择,但底层跑的是第三方托管方案,并发和延迟都有天花板。最近 Cloudflare 把整个 Browser Run 搬到了自家 Containers 平台上,并发能力翻了 4 倍、响应速度快了 50%。更重要的是,这一步把 Cloudflare 的 ...

KubeCon India 2026 孟买实战指南:从集群准备到街头生存

来源:cncf.io 20
2026 年 6 月 18-19 日,KubeCon + CloudNativeCon 首次登陆印度,选址孟买 BKC 的 Jio World Convention Centre。数千名云原生工程师即将涌入这座城市,很多人是第一次来。这篇文章不讲愿景,只讲实操——从你出发前该装什么工具,到落地后怎么在孟买的湿热里保持集群和身体都稳定运行。 参加 Kub...

从零搭 RAG 太折腾?pgEdge RAG Server 把检索、融合、流式全打包了

来源:postgr.es 32
如果你最近访问过 docs.pgedge.com,大概率已经碰到了 Ellie——一个只从文档里找答案、不瞎编的 AI 助手。问她"多主复制怎么配"或"MCP Server 监听哪个端口",她会把相关文档片段拉出来拼成上下文,再交给 LLM 生成带来源引用的回答。Ellie 不是魔法,它背后跑的就是 pgEdge 刚开放出来的 RAG Server:一...

在 Kubernetes 上把 LLM 冷启动压到 30 秒——网易游戏的实战路径

来源:cncf.io 31
弹性扩容听起来很美:流量来了就加 Pod,流量走了就缩容。但把这套逻辑搬到 LLM 推理服务上,现实会给你一记闷棍——模型权重动辄几十 GB,Pod 从零到可用,数据搬运的时间远比计算调度慢。网易游戏在生产环境中把这个冷启动过程压到了 30 秒,核心认知只有一句:弹性计算只有在数据能同等速度移动时才有意义。 一个典型 LLM 推理 Pod 的冷启动链路...