标签

AI

用 Amazon Bedrock AgentCore 构建多租户智能体:隔离、配置与落地实践

来源:aws.amazon.com 31
当你的 AI Agent 从内部工具走向 SaaS 产品,租户隔离就成了架构的第一道门槛。单租户场景下,Agent 共享同一个知识库、同一套工具权限、同一个上下文窗口,一切都很简单。但一旦多个客户接入,问题立刻浮现:A 客户的订单数据不能被 B 客户的 Agent 读到;不同客户对同一工具的调用策略可能完全不同;按租户计费和限流也需要精确到每个 ten...

用递归语言模型突破上下文窗口限制:Amazon Bedrock AgentCore 实战

来源:aws.amazon.com 38
大模型的上下文窗口一直在增长——128K、256K、甚至 1M tokens——但现实中的文档处理需求增长更快。一份年度财报、一套完整法规修订稿、一个大型代码仓库的跨模块审计,轻松就能超出任何单次调用的承载能力。Amazon Bedrock AgentCore 结合 Strands Agents SDK 提出了一种新思路:递归语言模型(Recursiv...

用 Amazon Bedrock AgentCore 构建商业智能 AI Agent 实战

来源:aws.amazon.com 21
商业智能(BI)团队每天都在和海量数据打交道——查报表、写 SQL、解读趋势、回答业务方反复追问的"为什么"。传统 BI 工具把数据摆在你面前,但解读和行动仍然依赖人的经验。把 AI Agent 引入 BI 流程,不是让模型替你做决策,而是让它在数据检索、趋势归纳、异常定位这些重复性环节上提速,把人的注意力留在判断和决策上。 Amazon 最近推出了 ...

用 Amazon Bedrock 搭一个 AI 招聘助手:从简历筛选到面试题生成

来源:aws.amazon.com 32
招聘流程里最耗时间的环节是什么?不是发 JD,不是安排日程,而是反复阅读大量简历、逐个提炼候选人亮点、再为每个人准备针对性的面试问题。这些工作机械但需要判断力,恰好是 AI 辅助的切入点。本文基于 AWS 官方给出的参考架构,拆解如何用 Amazon Bedrock 构建一个招聘助手——它能加速简历评估、生成个性化面试题、并为人类决策提供数据支撑。注意...

Nova:让编码 Agent 并行跑起来,也让内部系统自动用上 AI

来源:dropbox.tech 21
当工程师同时处理三四个分支的 bugfix、重构和功能开发时,逐个喂 prompt 给 Copilot 式工具效率并不高。Nova 要解决的问题很直接:把编码 Agent 从"单线程聊天"升级为"多会话并行 + 系统级调度"。工程师可以同时开多个编码会话,内部系统也能把 Agent 当作工作流的一环自动调用——不需要人盯着屏幕等结果。 传统编码助手的工...

用自然语言驱动数据看板:基于 Amazon Bedrock AgentCore 构建 Dashboard 自动化 Agent

来源:aws.amazon.com 28
数据看板的搭建和运维一直是件体力活——选指标、配图表、调筛选器、写 SQL,每个环节都离不开人工介入。Amazon 近期推出的 Bedrock AgentCore + Strands Agents + QuickSight Quick Transforms 组合方案,试图把这条链路缩短到一句话:你用自然语言描述需求,Agent 自动完成看板的生成、数据...

从 Demo 到上线:让 AI 真正跑在生产环境里的六堂课

来源:infoq.com 31
QCon AI Boston 2026 即将售罄,六场演讲直指一个让工程师头疼的现实——AI 在 demo 里表现惊艳,上了生产却处处翻车。模型延迟暴涨、输出格式飘忽、幻觉在关键业务里冒头、监控盲区让故障排查无从下手……这些问题不是理论探讨,而是每天在上线流程里绊脚的石头。 下面拆解几个最典型的"demo 到生产"断裂点,并给出可以直接拿来改造的工程方...

KubeCon India 2026 孟买实战指南:从集群准备到街头生存

来源:cncf.io 21
2026 年 6 月 18-19 日,KubeCon + CloudNativeCon 首次登陆印度,选址孟买 BKC 的 Jio World Convention Centre。数千名云原生工程师即将涌入这座城市,很多人是第一次来。这篇文章不讲愿景,只讲实操——从你出发前该装什么工具,到落地后怎么在孟买的湿热里保持集群和身体都稳定运行。 参加 Kub...

从零搭 RAG 太折腾?pgEdge RAG Server 把检索、融合、流式全打包了

来源:postgr.es 33
如果你最近访问过 docs.pgedge.com,大概率已经碰到了 Ellie——一个只从文档里找答案、不瞎编的 AI 助手。问她"多主复制怎么配"或"MCP Server 监听哪个端口",她会把相关文档片段拉出来拼成上下文,再交给 LLM 生成带来源引用的回答。Ellie 不是魔法,它背后跑的就是 pgEdge 刚开放出来的 RAG Server:一...