2026-05-27
来源:aws.amazon.com
14
单 Agent 能解决很多问题,但一旦任务涉及并行推理、上下文共享和执行可追溯,单线程的调用链就撑不住了。AWS 近期发布的集成方案把三个组件拼成了一条完整链路:Strands Agents 负责多 Agent 无服务器编排,NVIDIA NIM 提供 GPU 加速推理端点,Amazon Bedrock AgentCore 托管运行时、共享记忆和可观测...
2026-05-27
来源:postgr.es
31
从渥太华到温哥华,PGCon 换了城市也换了气质。今年新增的周二社区讨论日,让整周的信息密度翻了一倍。但真正值得记录的,不是海堤骑行或蒸汽钟,而是会场里那些直接影响 Postgres 未来走向的讨论和决策。 SQL/PGQ 是 PG 17 新提交的特性,让 Postgres 可以用标准 SQL 语法做图模式匹配。作者原本预期讨论会只有十几人,结果超过 ...
2026-05-27
来源:postgr.es
14
Christophe Pettus 正在逐个拆解主流托管 PostgreSQL 服务——RDS、Aurora、Cloud SQL 之后,第四站落在了 Google AlloyDB。它和 Aurora 的架构思路相似(分布式存储层替代本地磁盘),但实现路径和运营细节差异足够大,不能简单当作"GCP 版 Aurora"来用。 AlloyDB 的核心设计:P...
2026-05-27
来源:aws.amazon.com
31
把一个"让 AI 帮我查资料、整理摘要"的想法落地,听起来简单——调几个 API、拼几段 prompt 就行。但真正动手时你会发现:多轮对话的状态管理、工具调用的编排、错误重试、上下文窗口控制……每一项都能把一个周末项目拖成几个月的工程。Strands 的思路是:把这些重复的基建工作收进框架层,让开发者把精力放在"我的助手要做什么"而不是"怎么把 AP...
2026-05-27
来源:engineering.fb.com
18
推荐系统的检索环节长期被拆成多个独立组件:倒排索引、向量召回、粗排模型……各自维护、各自迭代,管线越堆越长,延迟和成本也随之膨胀。Meta 工程团队最近提出的 SilverTorch,用一个看似简单的思路重新审视了整条链路——把索引本身做成模型,将所有 UGC(用户生成内容)检索组件统一到一套架构下。结果:吞吐量提升最高 23.7 倍,相比 CPU 方...
2026-05-26
来源:docker.com
15
今年早些时候,有人用 Claude Code 把整个博客迁移到 Astro——146 篇文章、6024 张图片、Canonical URL、JSON-LD、Sitemap,全套重写。他花了好几个小时写一份 skills 文件,教代理理解博客架构、部署流程、哪些文件绝对不能碰。结果确实跑通了:组件重写、Bug 修复、批量迁移,全由代理完成。 但这个故事的...
2026-05-26
来源:postgr.es
30
过去两年,AI 行业的叙事重心几乎全在模型:哪个 LLM 参数更多、哪个向量数据库更快、哪个编排框架更灵活。但组织真正把 AI 推向生产环境时,撞上的墙往往不是模型能力不足——而是企业数据缺乏机器可读的意义。模型能生成流畅的语言,却无法判断 "active" 在 CRM 里指"可登录"还是在合规系统里指"受监控",更无法自动知道哪张表是权威来源、哪个字...
微服务时代,Jaeger 是工程师理解调用链的利器;如今 AI Agent 大量涌入生产环境,调用链从"服务 A → 服务 B"变成了"Agent 规划 → 调 LLM → 调工具 → 再规划"。链路更长、分支更多、失败模式更隐蔽。Jaeger 正在围绕 OpenTelemetry 做一轮针对性演进,让 Agent 的每一步决策都可观测。 微服务调用链...
2026-05-26
来源:infoq.com
17
AI 正从实验走向生产,但真正把模型推上线的人很快发现:技术挑战只占一半,另一半是团队怎么组织、平台怎么搭建、架构决策怎么拍板。InfoQ 新推出的 AI Engineering 和 Organizational Architecture 两个在线认证班,瞄准的就是这个痛点——给资深从业者一个保密的同行圈子,把你在生产环境里做的那些 AI、平台、团队和...
2026-05-26
来源:infoq.com
24
生产环境里的 AI 决策,没人敢在公开论坛上把真实数据、真实失败摊开来讲。InfoQ 新推出的 AI Engineering 和 Organizational Architecture 两个在线认证 cohort,瞄准的就是这个缺口——给有实战经验的资深从业者一个保密的同行圈子,把那些"还没想清楚但必须拍板"的架构、平台、团队设计决策拿出来压力测试。 ...