标签

InfoQ

Pinterest 如何揪出 Kubernetes 集群里的"CPU 僵尸"

来源:infoq.com 23
Pinterest 的机器学习训练任务在 PinCompute(基于 Kubernetes 的内部平台)上频繁出现性能抖动——训练跑着跑着就慢了,吞吐量忽高忽低,却找不到明显的业务代码问题。最终,工程师把根因锁定在一个根本没在用的 Amazon ECS Agent:它悄悄制造了 memory cgroup 泄漏,导致 CPU 调度出现饥饿。禁用该 Ag...

Claude Code 质量下滑六周的复盘:三个产品层变更叠加的隐蔽故障

来源:infoq.com 31
Anthropic 刚发布了一篇事后复盘,把过去六周里用户对 Claude Code 输出质量下降的投诉,追溯到三个彼此叠加的产品层变更——推理努力降级、缓存 bug 逐步吞噬模型自身思考、系统提示词冗余度限制带来 3% 的质量跌幅。模型权重和 API 本身没有任何改动,但用户感受到的退化远超任何一个单一因素的预期。 这件事值得每位做 LLM 产品的人...

Claude Code 质量滑坡复盘:三个"小改动"叠加的六周灾难

来源:infoq.com 25
Anthropic 刚发布了一份事后复盘,把过去六周里 Claude Code 用户抱怨质量下降的根因拆得清清楚楚——不是模型变笨了,而是三个产品层改动在同一时段叠加,像三把刀同时扎进同一条神经。API 和模型权重从头到尾没动过,但用户体验硬生生掉了 3% 以上,直到 4 月 20 日才全部修复。 这件事值得每个做 LLM 产品的团队细看:你以为改的是...

Airbnb 的上下文感知身份模型:如何让社交功能与隐私共存

来源:infoq.com 13
Airbnb 的 Experiences 业务让用户从"住客"变成了"活动参与者"——和陌生人一起做饭、冲浪、逛市集。社交属性一旦打开,身份暴露的风险也跟着来了:一个房东在住宿场景下的真实姓名、电话、住址,不应该自动出现在她参加陶艺体验时的公开档案里。Airbnb 的工程团队因此重构了整个身份系统,核心思路是:全局身份只存在于内部,对外可见的档案按上下...

JDK 27 结构化并发异常处理收紧:JEP 533 带来了什么变化

来源:infoq.com 14
结构化并发(Structured Concurrency)从 JEP 453 进入 JDK 21 以来,一直在打磨细节。JEP 533 在 JDK 27 中进入集成状态,核心改动集中在异常处理和类型安全——具体来说,引入了新的 类型,更新了 接口,并新增了 方法的重载,让配置更顺手。这些变化不是大刀阔斧的重写,而是把之前模糊的边界收紧,让异常流变得可预...

AdonisJS v7:端到端类型安全、零配置 OpenTelemetry 与全新起步套件

来源:infoq.com 26
AdonisJS v7 一次把三件大事落地:从路由到 ORM 的端到端类型安全、零配置即可启用的 OpenTelemetry 可观测性、以及重新设计的起步套件。整个发布涉及 45+ 个包更新、3 个全新包,并把运行门槛抬到了 Node.js 24——直接用上原生 、 等 API,不再 shim。如果你一直在等一个"全栈 TypeScript 框架终于把...

仓颉语言:把代数数据类型和效应处理器做成一等公民的编译型新语言

来源:infoq.com 15
华为编程语言实验室负责人 Dan Ghika 教授最近公开介绍了仓颉(Cangjie)——一门定位对标 Java、Kotlin、Swift 的应用开发语言。它已经开源,目前在中国超过 80 所高校开设了课程。和主流对手相比,仓颉最显眼的差异在于两件事:代数数据类型(ADT)和效应处理器(Effect Handlers)不是后加的库,而是语言内核的一部分...

把 AI 编码 Agent 拉回自己的机房:Coder Agents 的自托管思路

来源:infoq.com 29
AI 编码 Agent 正在重塑开发流程,但大多数团队的使用方式是把代码和数据送进别人的云——SaaS 平台托管 Agent,代码在远端执行,结果再传回来。对于合规要求严格、代码资产敏感的团队,这条路越走越窄。Coder Agents 的核心主张很简单:Agent 留在你的基础设施上跑,模型你可以自己选,代码和数据不出你的边界。 云托管 AI Agen...

Netflix 用时间段感知缓存让 Druid 84% 的查询命中缓存

来源:infoq.com 32
Netflix 的实时分析平台每天要处理海量滚动窗口查询——"过去 7 天的用户留存""过去 30 天的播放趋势"。这类查询天然有个痛点:每天只有最新一小段数据变了,但传统缓存策略要么整段命中要么全部重算。Netflix 在 Apache Druid 上实现了 interval-aware caching(时间段感知缓存),把查询按时间区间拆成可复用的...