标签

架构设计

用 Strands Agents + NVIDIA NIM + Bedrock AgentCore 搭建高性能多 Agent 系统

来源:aws.amazon.com 14
单 Agent 能解决很多问题,但一旦任务涉及并行推理、上下文共享和执行可追溯,单线程的调用链就撑不住了。AWS 近期发布的集成方案把三个组件拼成了一条完整链路:Strands Agents 负责多 Agent 无服务器编排,NVIDIA NIM 提供 GPU 加速推理端点,Amazon Bedrock AgentCore 托管运行时、共享记忆和可观测...

PGConf.dev 2026:温哥华一周,Postgres 走向何方

来源:postgr.es 31
从渥太华到温哥华,PGCon 换了城市也换了气质。今年新增的周二社区讨论日,让整周的信息密度翻了一倍。但真正值得记录的,不是海堤骑行或蒸汽钟,而是会场里那些直接影响 Postgres 未来走向的讨论和决策。 SQL/PGQ 是 PG 17 新提交的特性,让 Postgres 可以用标准 SQL 语法做图模式匹配。作者原本预期讨论会只有十几人,结果超过 ...

用 Strands 搭建智能研究助手:从想法到可运行的 AI 应用

来源:aws.amazon.com 31
把一个"让 AI 帮我查资料、整理摘要"的想法落地,听起来简单——调几个 API、拼几段 prompt 就行。但真正动手时你会发现:多轮对话的状态管理、工具调用的编排、错误重试、上下文窗口控制……每一项都能把一个周末项目拖成几个月的工程。Strands 的思路是:把这些重复的基建工作收进框架层,让开发者把精力放在"我的助手要做什么"而不是"怎么把 AP...

SilverTorch:把索引做成模型——推荐系统检索的新范式

来源:engineering.fb.com 18
推荐系统的检索环节长期被拆成多个独立组件:倒排索引、向量召回、粗排模型……各自维护、各自迭代,管线越堆越长,延迟和成本也随之膨胀。Meta 工程团队最近提出的 SilverTorch,用一个看似简单的思路重新审视了整条链路——把索引本身做成模型,将所有 UGC(用户生成内容)检索组件统一到一套架构下。结果:吞吐量提升最高 23.7 倍,相比 CPU 方...

当 AI 编码代理成为「不可信工作负载」,隔离边界该怎么画?

来源:docker.com 15
今年早些时候,有人用 Claude Code 把整个博客迁移到 Astro——146 篇文章、6024 张图片、Canonical URL、JSON-LD、Sitemap,全套重写。他花了好几个小时写一份 skills 文件,教代理理解博客架构、部署流程、哪些文件绝对不能碰。结果确实跑通了:组件重写、Bug 修复、批量迁移,全由代理完成。 但这个故事的...

企业 AI 的真正瓶颈不在模型,而在语义基础设施

来源:postgr.es 30
过去两年,AI 行业的叙事重心几乎全在模型:哪个 LLM 参数更多、哪个向量数据库更快、哪个编排框架更灵活。但组织真正把 AI 推向生产环境时,撞上的墙往往不是模型能力不足——而是企业数据缺乏机器可读的意义。模型能生成流畅的语言,却无法判断 "active" 在 CRM 里指"可登录"还是在合规系统里指"受监控",更无法自动知道哪张表是权威来源、哪个字...

用 Jaeger + OpenTelemetry 给 AI Agent 加上分布式追踪

来源:cncf.io 18
微服务时代,Jaeger 是工程师理解调用链的利器;如今 AI Agent 大量涌入生产环境,调用链从"服务 A → 服务 B"变成了"Agent 规划 → 调 LLM → 调工具 → 再规划"。链路更长、分支更多、失败模式更隐蔽。Jaeger 正在围绕 OpenTelemetry 做一轮针对性演进,让 Agent 的每一步决策都可观测。 微服务调用链...

InfoQ 推出 AI 工程与组织架构认证班:资深从业者如何用同行压力测试生产决策

来源:infoq.com 17
AI 正从实验走向生产,但真正把模型推上线的人很快发现:技术挑战只占一半,另一半是团队怎么组织、平台怎么搭建、架构决策怎么拍板。InfoQ 新推出的 AI Engineering 和 Organizational Architecture 两个在线认证班,瞄准的就是这个痛点——给资深从业者一个保密的同行圈子,把你在生产环境里做的那些 AI、平台、团队和...

InfoQ 新增 AI 工程与组织架构认证 cohort:给资深从业者一个私密试错场

来源:infoq.com 24
生产环境里的 AI 决策,没人敢在公开论坛上把真实数据、真实失败摊开来讲。InfoQ 新推出的 AI Engineering 和 Organizational Architecture 两个在线认证 cohort,瞄准的就是这个缺口——给有实战经验的资深从业者一个保密的同行圈子,把那些"还没想清楚但必须拍板"的架构、平台、团队设计决策拿出来压力测试。 ...