分类

文章

千人级 AI 平台的可观测性:如何看清谁在用、用得好不好

来源:aws.amazon.com 27
当企业 AI 平台从几十人试点扩展到上千人日常使用时,平台 owner 面对的核心问题变了——不再是"能不能跑起来",而是"谁在用、用得怎样、哪些能力最被需要"。这些数据散落在 CloudTrail 日志、CloudWatch 指标、S3 对话记录和 QuickSight 报表里,没有统一的视角,决策就只能靠猜。 这篇文章拆解一套面向 Amazon Q...

SilverTorch:把索引做成模型——推荐系统检索的新范式

来源:engineering.fb.com 19
推荐系统的检索环节长期被拆成多个独立组件:倒排索引、向量召回、粗排模型……各自维护、各自迭代,管线越堆越长,延迟和成本也随之膨胀。Meta 工程团队最近提出的 SilverTorch,用一个看似简单的思路重新审视了整条链路——把索引本身做成模型,将所有 UGC(用户生成内容)检索组件统一到一套架构下。结果:吞吐量提升最高 23.7 倍,相比 CPU 方...

你的系统里还藏着什么?——从一块 90 年代 PostgreSQL 扩展的缓冲区溢出说起

来源:postgr.es 29
2026 年,一个诞生于 1990 年代的 PostgreSQL 扩展被检出高危缓冲区溢出漏洞。这件事本身不算罕见——老代码有老毛病,修了就好。真正让人不安的是另一个事实:大多数团队根本说不清自己系统里到底装了哪些扩展、哪些依赖、哪些已经没人维护的陈旧组件。 漏洞不是最可怕的,看不见才是。 PostgreSQL 的扩展生态从 90 年代就开始生长。很多...

Amazon Quick:把文档和可视化从数小时压缩到数分钟

来源:aws.amazon.com 33
每周写周报、做数据可视化、整理项目复盘——这些"低技术含量却高耗时"的任务,悄悄吞噬了专业工作者大量时间。Amazon Quick 的核心承诺很简单:把文档生成和可视化创建从手工拼装变成意图驱动的自动产出,让你从"执行排版"回到"做判断"。 大多数专业角色都有一个不成文的假设:你应该花相当一部分时间在格式调整、图表配色、数据搬运上。结果是—— 一份季度...

PGConf.dev 2026:Postgres 集群拓扑、物理读观测与排序的三道未解题

来源:postgr.es 23
刚从温哥华回来,PGConf.dev 2026 的技术讨论密度远超预期。Jeremy Schneider 在会后总结中梳理了几条真正触及 Postgres 设计短板的线索——不是"新功能很酷"那种,而是"我们一直假装没问题但其实有结构性缺口"那种。下面挑三条最值得生产环境用户关注的展开。 物理复制做高可用,已经是 Postgres 用户最主流的方案。但...

用 Python MCP Server 把大模型接上你的真实数据

来源:realpython.com 32
大模型能写代码、能聊天,但一到"查公司内部数据库""读项目私有文档"就卡壳——它根本看不到你的数据。MCP(Model Context Protocol)就是解决这个断层的协议:你写一个 MCP Server,把数据暴露成 工具、资源、提示词 三类能力,AI 客户端(Cursor、Claude Desktop 等)就能像调用本地函数一样直接操作你的数据...

TLX Block Attention:为 Blackwell 架构量身定制的块稀疏注意力内核

来源:pytorch.org 25
大模型推理和训练的算力瓶颈,很大一部分卡在 self-attention 的 O(n²) 复杂度上。块对角稀疏(block-diagonal sparse)注意力是一种实用的压缩策略——只在固定大小的对角块内计算注意力,其余位置直接跳过。问题在于:现有内核多为通用稀疏注意力设计,没有针对固定块模式做编译期优化,更没有利用新一代 GPU 的硬件特性。 M...

选对 MySQL ADO.NET Provider:异步性能、许可证与 EF Core 集成才是真正的分水岭

来源:devart.com 25
开发阶段,几乎所有 MySQL ADO.NET Provider 都能跑通 CRUD——连接字符串写对, 一开,查询结果就回来了。真正的差异藏在三个地方:高并发下的异步表现、许可证是否给生产环境留坑、与 EF Core 及云环境的磨合程度。这些差异不会在本地调试时暴露,而是在流量上来、团队扩张、部署走向混合云时才突然变成阻力。 下面从实际选型角度拆解 ...

当 AI 编码代理成为「不可信工作负载」,隔离边界该怎么画?

来源:docker.com 16
今年早些时候,有人用 Claude Code 把整个博客迁移到 Astro——146 篇文章、6024 张图片、Canonical URL、JSON-LD、Sitemap,全套重写。他花了好几个小时写一份 skills 文件,教代理理解博客架构、部署流程、哪些文件绝对不能碰。结果确实跑通了:组件重写、Bug 修复、批量迁移,全由代理完成。 但这个故事的...