分类

文章

PostgreSQL 与 Linux 页缓存的爱恨纠葛:读懂 backend_flush_after

来源:postgr.es 16
PostgreSQL 把数据写到共享缓冲区,再交给 Linux 页缓存,最终由内核刷回磁盘。这条链路看起来顺理成章,但 Linux 的刷盘节奏并不总是对数据库友好——脏页堆积到阈值后,内核可能一次性倾泻大量 I/O,造成查询卡顿甚至整个系统抖动。为了夺回主动权,PostgreSQL 从 9.6 起引入了四个 GUC,而 是其中最保守、也最容易被忽视的那...

TanStack npm 供应链攻击事件复盘:OpenAI 的应急响应与你的防御清单

来源:openai.com 23
2025 年,一个代号 "Mini Shai-Hulud" 的供应链攻击通过 TanStack 的 npm 包潜入了开发者的工具链。OpenAI 近日公开了完整的应急响应细节——从签名证书的保护到 macOS 用户必须在 2026 年 6 月 12 日前更新应用的硬性要求。这不是又一篇"供应链很重要"的口号文章,而是从一次真实事件中提取的攻防时间线、影...

Kubernetes v1.33→1.36:PSI 指标正式 GA,节点资源阻塞终于看得见

来源:kubernetes.io 24
CPU 利用率 80%,看起来还有余量——但调度延迟已经让关键 Pod 的请求排队数百毫秒。这种"利用率正常、实际已经卡死"的盲区,在 Kubernetes 里长期存在。v1.36 中 PSI(Pressure Stall Information)指标从 Beta 晋升 GA,意味着你终于有一个稳定接口,直接观测节点、Pod、容器三个层面的资源阻塞,而...

Docker AI Governance:让 AI Agent 在你的笔记本上安全地"上生产"

来源:docker.com 22
AI Agent 正在成为开发者日常中最强的生产力杠杆——但问题也随之浮现:一个能读写文件、调用 API、访问数据库的 Agent,跑在你的笔记本上,本质上已经拥有了"生产级"的权限。如果你的团队里每个人都在本地跑 Agent,谁来保证它们不会误删数据库、不会把密钥泄露到外部网络、不会调用不该调用的 MCP 工具? Docker 的回答是:把笔记本当作...

SAP Sapphire 2026:Azure 上的企业 AI 正从"能用"走向"好用"

来源:azure.microsoft.com 16
微软和 SAP 在 Sapphire 2026 上发布了一轮新公告,核心信号很明确——企业 AI 不再只是演示和试点,而是要在 Azure 上跑出规模。从运营流程、决策辅助到创新加速,双方正在把 AI 能力嵌入 SAP 生态的每一层,而不是停留在"外挂一个聊天窗口"的阶段。 过去几年,SAP on Azure 的主叙事是"把 ERP 搬上云"——SAP...

用 Bedrock 知识库把监管问询从数天压缩到数小时——Amazon FinTech 的做法

来源:aws.amazon.com 15
监管问询(regulatory inquiry)是金融团队最头疼的事之一:审计机构或监管部门抛出一连串问题,团队需要在海量文档里翻找依据、组织措辞、逐条回复。传统流程靠人工检索和邮件流转,一条问询可能耗时数天甚至数周。Amazon FinTech 团队用 Amazon Bedrock + Knowledge Base 把这个过程做成了可扩展的 AI 应...

Meta 大规模数据摄入系统迁移实录:保障社交图谱快照可靠性的架构演进

来源:engineering.fb.com 33
社交图谱是 Meta 众多核心业务——从内容推荐到反滥用系统——的底层数据基座。要保持这些业务的实时性,下游必须时刻获取社交图谱的最新快照,而这背后依赖的是一个庞大的数据摄入系统。近期,Meta 对这套系统进行了全面重构,以解决大规模场景下的可靠性瓶颈。将一个服务于全公司级别的单点旧系统,无缝切换到全新架构,绝非简单的"停机更新",而是一场需要极度精细...

用视觉嵌入 + Agent 自动生成 IDP 文档 Schema

来源:aws.amazon.com 15
面对一堆来源未知的文档——发票、合同、报关单、体检报告混在一起——传统 IDP 流程的第一步就卡住了:你得先人工识别文档类型,再逐个手写提取 Schema。文档种类多、格式杂,这一步往往比后续抽取本身更耗时。 本文介绍的多文档发现(Multi-Document Discovery)功能,把这个前置步骤自动化了:先用视觉嵌入把文档按类型聚类,再让 Age...

ExecuTorch 实战:在 Arm CPU 与 NPU 上跑起端侧 AI 推理

来源:pytorch.org 14
把大模型塞进手机、嵌入式板卡里本地跑推理,不再是实验室里的概念验证——ExecuTorch 把 PyTorch 的导出、量化、部署流水线直接搬到了资源受限的边缘设备上。Arm 近期发布了一组配套 Jupyter Labs,让开发者不用啃完整文档就能上手。这篇文章拆解 ExecuTorch 的关键机制,并给出一条从模型导出到 Arm 设备推理的可操作路径...

在 SageMaker 上追踪 LLM 微调 FLOPs,一次配置搞定 EU AI Act 合规审计

来源:aws.amazon.com 19
欧盟《人工智能法案》(EU AI Act)已经生效,其中一条容易被忽视的规则是:通用目的 AI(GPAI)模型如果训练或微调的计算量超过 10²⁵ FLOPs,将被归类为"系统性风险"模型,触发更严格的透明度与安全义务。 对在 AWS 上用 SageMaker 微调大模型的团队来说,问题很具体——你怎么知道自己的任务有没有踩线?又怎么向审计方证明? 开...