标签

AI

SilverTorch:把索引做成模型——推荐系统检索的新范式

来源:engineering.fb.com 19
推荐系统的检索环节长期被拆成多个独立组件:倒排索引、向量召回、粗排模型……各自维护、各自迭代,管线越堆越长,延迟和成本也随之膨胀。Meta 工程团队最近提出的 SilverTorch,用一个看似简单的思路重新审视了整条链路——把索引本身做成模型,将所有 UGC(用户生成内容)检索组件统一到一套架构下。结果:吞吐量提升最高 23.7 倍,相比 CPU 方...

Amazon Quick:把文档和可视化从数小时压缩到数分钟

来源:aws.amazon.com 33
每周写周报、做数据可视化、整理项目复盘——这些"低技术含量却高耗时"的任务,悄悄吞噬了专业工作者大量时间。Amazon Quick 的核心承诺很简单:把文档生成和可视化创建从手工拼装变成意图驱动的自动产出,让你从"执行排版"回到"做判断"。 大多数专业角色都有一个不成文的假设:你应该花相当一部分时间在格式调整、图表配色、数据搬运上。结果是—— 一份季度...

PGConf.dev 2026:Postgres 集群拓扑、物理读观测与排序的三道未解题

来源:postgr.es 23
刚从温哥华回来,PGConf.dev 2026 的技术讨论密度远超预期。Jeremy Schneider 在会后总结中梳理了几条真正触及 Postgres 设计短板的线索——不是"新功能很酷"那种,而是"我们一直假装没问题但其实有结构性缺口"那种。下面挑三条最值得生产环境用户关注的展开。 物理复制做高可用,已经是 Postgres 用户最主流的方案。但...

用 Python MCP Server 把大模型接上你的真实数据

来源:realpython.com 32
大模型能写代码、能聊天,但一到"查公司内部数据库""读项目私有文档"就卡壳——它根本看不到你的数据。MCP(Model Context Protocol)就是解决这个断层的协议:你写一个 MCP Server,把数据暴露成 工具、资源、提示词 三类能力,AI 客户端(Cursor、Claude Desktop 等)就能像调用本地函数一样直接操作你的数据...

TLX Block Attention:为 Blackwell 架构量身定制的块稀疏注意力内核

来源:pytorch.org 25
大模型推理和训练的算力瓶颈,很大一部分卡在 self-attention 的 O(n²) 复杂度上。块对角稀疏(block-diagonal sparse)注意力是一种实用的压缩策略——只在固定大小的对角块内计算注意力,其余位置直接跳过。问题在于:现有内核多为通用稀疏注意力设计,没有针对固定块模式做编译期优化,更没有利用新一代 GPU 的硬件特性。 M...

当 AI 编码代理成为「不可信工作负载」,隔离边界该怎么画?

来源:docker.com 16
今年早些时候,有人用 Claude Code 把整个博客迁移到 Astro——146 篇文章、6024 张图片、Canonical URL、JSON-LD、Sitemap,全套重写。他花了好几个小时写一份 skills 文件,教代理理解博客架构、部署流程、哪些文件绝对不能碰。结果确实跑通了:组件重写、Bug 修复、批量迁移,全由代理完成。 但这个故事的...

用 Python MCP Server 把 LLM 接上你的真实数据

来源:realpython.com 22
大模型能聊天,但聊不了你的数据库、内部 API 和本地文件——直到 MCP(Model Context Protocol)出现。MCP 是 Anthropic 掐出的开放协议,定义了 LLM 如何与外部数据源和工具对接。对 Python 开发者来说,写一个 MCP Server 比想象中简单:几行代码就能让 Claude 或其他兼容客户端直接调用你定义...

Python 数据采集与存储:CSV、JSON、SQL 实战速查

来源:realpython.com 23
日常开发中,数据不会凭空出现——要么从文件读入,要么从数据库查询。CSV、JSON 和 SQL 是 Python 数据处理的三条主干道,掌握它们的读写细节,能避免大量低级错误和性能坑。 下面按格式逐一梳理关键操作,附带可直接运行的代码。 CSV 看起来简单,实际暗藏陷阱:编码问题、逗号出现在字段内部、换行符不一致。Python 标准库 模块已经处理了大...

Python 异常、日志与调试:从踩坑到顺手的三件套

来源:realpython.com 26
写 Python 代码,最怕的不是逻辑复杂,而是程序跑着跑着就"沉默崩溃"——没有报错信息,没有日志痕迹,只剩一个空荡荡的终端。异常处理、日志记录和调试手段,这三样东西单独看都不难,但真正在项目里用到位的人不多。下面把常见坑和实用模式串起来讲,每段都带可跑的代码。 新手最常见的写法: 这段代码的问题不是语法,而是把所有错误都吞掉了,后续排查时你连崩溃原...