标签

AI

Pinterest 如何揪出 Kubernetes 集群里的"CPU 僵尸"

来源:infoq.com 24
Pinterest 的机器学习训练任务在 PinCompute(基于 Kubernetes 的内部平台)上频繁出现性能抖动——训练跑着跑着就慢了,吞吐量忽高忽低,却找不到明显的业务代码问题。最终,工程师把根因锁定在一个根本没在用的 Amazon ECS Agent:它悄悄制造了 memory cgroup 泄漏,导致 CPU 调度出现饥饿。禁用该 Ag...

小企业用 Claude:把"人手不够"变成"流程自动化"

来源:oschina.net 20
小企业长期卡在一个结构性困境里:要做的事和大公司没本质区别——工资核算、月末结算、发票催收、客户跟进、营销策划,一样都少不了。但人手只有五六个,工具预算几乎为零,结果就是老板自己加班填表、财务兼职做客服。Anthropic 推出的 Claude for Small Business,瞄准的就是这个缺口:不是给大企业再造一套复杂系统,而是让小团队用最轻的...

Claude Code 质量下滑六周的复盘:三个产品层变更叠加的隐蔽故障

来源:infoq.com 32
Anthropic 刚发布了一篇事后复盘,把过去六周里用户对 Claude Code 输出质量下降的投诉,追溯到三个彼此叠加的产品层变更——推理努力降级、缓存 bug 逐步吞噬模型自身思考、系统提示词冗余度限制带来 3% 的质量跌幅。模型权重和 API 本身没有任何改动,但用户感受到的退化远超任何一个单一因素的预期。 这件事值得每位做 LLM 产品的人...

Claude Code 质量滑坡复盘:三个"小改动"叠加的六周灾难

来源:infoq.com 26
Anthropic 刚发布了一份事后复盘,把过去六周里 Claude Code 用户抱怨质量下降的根因拆得清清楚楚——不是模型变笨了,而是三个产品层改动在同一时段叠加,像三把刀同时扎进同一条神经。API 和模型权重从头到尾没动过,但用户体验硬生生掉了 3% 以上,直到 4 月 20 日才全部修复。 这件事值得每个做 LLM 产品的团队细看:你以为改的是...

OpenAI 遭 TanStack npm 供应链攻击:两台设备受影响,代码签名证书全面轮换

来源:oschina.net 20
2026年5月13日,OpenAI 发布安全公告,正式回应此前 TanStack npm 供应链攻击波及自身一事。结论是:两台员工设备被攻陷,但用户数据、生产系统、软件产物均未发现异常。尽管如此,OpenAI 依然选择全面轮换代码签名证书,并要求 macOS 用户在6月12日前完成应用更新。 这不是一次"没事就好"的轻描淡写——它暴露了 npm 供应链...

从试点到生产:红帽与 NVIDIA AI 工厂如何让自主智能体真正跑起来

来源:oschina.net 32
企业 AI 项目有一个普遍痛点:试点阶段效果惊艳,一旦要上生产、要长期跑、要合规审计,就卡住了。红帽与 NVIDIA 联合推出的 AI 工厂(Red Hat AI Factory with NVIDIA)最新进展,瞄准的就是这个断层——不是再造一个模型框架,而是在基础设施层补上安全、合规、生命周期管理这些"无聊但致命"的环节。 自主智能体和传统微服务不...

1.08 亿美元算力捐赠:黄仁勋基金会如何打通学术 AI 的算力瓶颈

来源:oschina.net 15
AI 研究的门槛正在被算力成本重新定义。当工业界动辄囤积上万块 H100 组建集群时,高校实验室却常常为几块 A100 的租用费精打细算。5 月 13 日路透社报道的一笔捐赠,直接把这个问题推到了台前:黄仁勋与妻子 Lori 共同创立的慈善基金会,向 GPU 云服务商 CoreWeave 购买了价值 1.083 亿美元的 AI 算力,捐赠给大学和非营利...

TencentDB Agent Memory 开源:给 AI Agent 装上一套分层记忆引擎

来源:oschina.net 15
做 AI Agent 的人大概都踩过同一个坑——对话越长,Agent 越蠢。不是模型能力不行,是上下文窗口塞满了碎片信息,关键指令被淹没,历史经验每次都要从头再来。腾讯云数据库团队刚开源的 TencentDB Agent Memory,瞄准的就是这个问题:用分层记忆 + 符号化存储,让 Agent 在超长任务中保持清醒,在跨会话场景里复用经验。 项目采...

DeepSeek 专家模式文件上传突然下线,长文档处理怎么办

来源:oschina.net 22
5 月 14 日,不少用户发现 DeepSeek 的"专家模式"里文件上传按钮已经灰掉,官方提示只有一句——"资源紧张,不支持文件上传"。此前专家模式因为上下文窗口更长、推理链更深,一直是处理长 PDF、合同、论文的首选入口。现在这个能力突然缩水,快速模式还能上传图片做 OCR,但文本层面的深度推理没了载体。 这不是第一次出现资源紧张的情况,DeepS...

LLM 正在拆掉云原生架构的地基

来源:oschina.net 19
2010 年前后,整个行业达成了一个共识:计算无状态,状态归数据库。应用服务器随便加,负载均衡器随便转发,请求落到哪台机器都一样——因为真相只存在于数据库里。这套范式统治了二十年,Kubernetes、微服务、Serverless 全是它的产物。 但当你把一个 LLM 接进系统,这根支柱开始晃了。 云原生的核心等式很简单: 想扩容?垂直升级数据库(换更...