分类

文章

用 Strands 搭建智能研究助手:从想法到可运行的 AI 应用

来源:aws.amazon.com 32
把一个"让 AI 帮我查资料、整理摘要"的想法落地,听起来简单——调几个 API、拼几段 prompt 就行。但真正动手时你会发现:多轮对话的状态管理、工具调用的编排、错误重试、上下文窗口控制……每一项都能把一个周末项目拖成几个月的工程。Strands 的思路是:把这些重复的基建工作收进框架层,让开发者把精力放在"我的助手要做什么"而不是"怎么把 AP...

千人级 AI 平台的可观测性:如何看清谁在用、用得好不好

来源:aws.amazon.com 27
当企业 AI 平台从几十人试点扩展到上千人日常使用时,平台 owner 面对的核心问题变了——不再是"能不能跑起来",而是"谁在用、用得怎样、哪些能力最被需要"。这些数据散落在 CloudTrail 日志、CloudWatch 指标、S3 对话记录和 QuickSight 报表里,没有统一的视角,决策就只能靠猜。 这篇文章拆解一套面向 Amazon Q...

SilverTorch:把索引做成模型——推荐系统检索的新范式

来源:engineering.fb.com 19
推荐系统的检索环节长期被拆成多个独立组件:倒排索引、向量召回、粗排模型……各自维护、各自迭代,管线越堆越长,延迟和成本也随之膨胀。Meta 工程团队最近提出的 SilverTorch,用一个看似简单的思路重新审视了整条链路——把索引本身做成模型,将所有 UGC(用户生成内容)检索组件统一到一套架构下。结果:吞吐量提升最高 23.7 倍,相比 CPU 方...

你的系统里还藏着什么?——从一块 90 年代 PostgreSQL 扩展的缓冲区溢出说起

来源:postgr.es 29
2026 年,一个诞生于 1990 年代的 PostgreSQL 扩展被检出高危缓冲区溢出漏洞。这件事本身不算罕见——老代码有老毛病,修了就好。真正让人不安的是另一个事实:大多数团队根本说不清自己系统里到底装了哪些扩展、哪些依赖、哪些已经没人维护的陈旧组件。 漏洞不是最可怕的,看不见才是。 PostgreSQL 的扩展生态从 90 年代就开始生长。很多...

Amazon Quick:把文档和可视化从数小时压缩到数分钟

来源:aws.amazon.com 33
每周写周报、做数据可视化、整理项目复盘——这些"低技术含量却高耗时"的任务,悄悄吞噬了专业工作者大量时间。Amazon Quick 的核心承诺很简单:把文档生成和可视化创建从手工拼装变成意图驱动的自动产出,让你从"执行排版"回到"做判断"。 大多数专业角色都有一个不成文的假设:你应该花相当一部分时间在格式调整、图表配色、数据搬运上。结果是—— 一份季度...

PGConf.dev 2026:Postgres 集群拓扑、物理读观测与排序的三道未解题

来源:postgr.es 23
刚从温哥华回来,PGConf.dev 2026 的技术讨论密度远超预期。Jeremy Schneider 在会后总结中梳理了几条真正触及 Postgres 设计短板的线索——不是"新功能很酷"那种,而是"我们一直假装没问题但其实有结构性缺口"那种。下面挑三条最值得生产环境用户关注的展开。 物理复制做高可用,已经是 Postgres 用户最主流的方案。但...

用 Python MCP Server 把大模型接上你的真实数据

来源:realpython.com 32
大模型能写代码、能聊天,但一到"查公司内部数据库""读项目私有文档"就卡壳——它根本看不到你的数据。MCP(Model Context Protocol)就是解决这个断层的协议:你写一个 MCP Server,把数据暴露成 工具、资源、提示词 三类能力,AI 客户端(Cursor、Claude Desktop 等)就能像调用本地函数一样直接操作你的数据...

TLX Block Attention:为 Blackwell 架构量身定制的块稀疏注意力内核

来源:pytorch.org 25
大模型推理和训练的算力瓶颈,很大一部分卡在 self-attention 的 O(n²) 复杂度上。块对角稀疏(block-diagonal sparse)注意力是一种实用的压缩策略——只在固定大小的对角块内计算注意力,其余位置直接跳过。问题在于:现有内核多为通用稀疏注意力设计,没有针对固定块模式做编译期优化,更没有利用新一代 GPU 的硬件特性。 M...