标签

架构设计

用 MySQL HeatWave 高可用与读副本构建抗脆弱 API

来源:blogs.oracle.com 34
云上应用对可用性的要求已经从"尽量不宕机"演变为"宕机是常态,代码要扛住"。数据库主节点切换、副本复制延迟、网络瞬断——这些在分布式环境中不是意外,而是日常。MySQL HeatWave 提供了内置的高可用(HA)和读副本(Read Replica)机制,但光靠数据库本身不够,API 层必须主动配合,才能把"基础设施抖动"对用户的影响降到最低。 Hea...

勒索软件后的 AWS 灾备:当备份与凭证不再可信时的恢复策略

来源:aws.amazon.com 34
传统灾备防的是地震、断电这类"天灾",底层逻辑是:基础设施是可信的,只要把数据从异地拉起来,业务就能跑。但勒索软件和恶意破坏是"人祸"——攻击者不仅加密数据,还会刻意污染你的备份、窃取你的高权凭证、在基础设施里植入后门。 网络韧性(Cyber resilience)的核心不是防,也不是查,而是:当备份、凭证和部分基础设施都不再可信时,如何把工作负载恢复...

AgentScope Java 1.1.0:Harness 工程框架落地,从本地提效到分布式 Agent 一套搞定

来源:my.oschina.net 34
AgentScope Java 1.1.0 把之前规划中的 Harness Framework 全部交付了。这意味着 Java 开发者不再需要自己拼凑 Agent 的基础设施——消息路由、服务发现、容错重试、分布式编排这些"脏活"都由 Harness 承担,你只需要关注 Agent 的业务逻辑。 从个人提效的 Coding Agent 到企业级的 SR...

Memcached 1.6.42:一次以安全为重心的硬核修补

来源:oschina.net 18
Memcached 作为生产环境中最常见的分布式缓存之一,常年暴露在高并发、多租户的网络边界上。1.6.42 版本几乎把所有修复精力都砸在了安全问题上——内存损坏、崩溃风险、认证侧信道,一个都没放过。如果你的服务还在跑老版本,这轮更新值得立刻安排。 本次更新覆盖了多个模块,核心修复集中在三类风险: 1. SASL 认证时序侧信道 SASL 密码数据库认...

MDP 主数据平台 1.2.0:一套代码,微服务与单体自由切换

来源:oschina.net 29
主数据平台的架构选择一直是团队早期最纠结的决策之一——上微服务怕运维成本爆炸,留单体怕后期拆分痛苦。MDP 1.2.0 给了一个务实的答案:同一套业务代码,不改逻辑,通过配置和构建方式决定最终跑成单体还是微服务。与此同时,这版把 Spring Boot、Dubbo、Nacos 等核心依赖全线拉到最新,底座安全性和兼容性同步刷新。 核心思路并不神秘:模块...

用 Amazon EKS 跑地质岩芯识别模型:ALS LITHOLENS 的工程实践

来源:aws.amazon.com 21
地质岩芯编录(core logging)是矿产勘探中最耗人力的环节之一——地质师需要逐段观察钻探取出的岩芯,记录岩性、结构、矿物含量,一条钻孔往往产生数百米样本,全靠肉眼和经验判断。ALS GeoAnalytics 的 LITHOLENS™ 把这件事交给机器学习:对岩芯高分辨率图像做自动识别与分类,大幅压缩编录时间,同时让结果更可复现。 但模型从实验室...

用异步帧生成流水线把 GPU 利用率从 82% 拉到 99.9%——视频推理加速实战

来源:aws.amazon.com 16
视频生成模型推理有一个老问题:VAE 解码器逐帧吐出画面,每帧都要从 GPU 搬到 CPU 做后处理(编码、封装),GPU 在等数据搬运完成的那段时间几乎是空转。Synthesia 与 AWS 合作在 EC2 G7e 实例上验证了一种叫 Asynchronous Frame Generation Pipeline 的方案,把 GPU 计算、设备到主机(...

PostgreSQL 为什么成了 AI 应用的默认数据库

来源:postgr.es 34
越来越多的 AI 产品在技术栈里选了 PostgreSQL——不是因为它重新包装成"AI 数据库",而是因为它本来就是团队最熟悉、最可靠的那层基础设施。Supabase 的普及加速了这一趋势:每次创建 Supabase 项目,底层就是一个 PostgreSQL 实例。主流 AI 框架对 PostgreSQL 和 pgvector 的直接支持,让向量检索...