标签

机器学习

在 Amazon Bedrock AgentCore Gateway 上启用 MCP 2026-07-28

2026-07-29 来源: aws.amazon.com 25

MCP 2026-07-28 是该协议发布以来规模最大的一次修订：协议转向无状态运行，引入受治理的扩展体系，并强化授权机制。Amazon Bedrock AgentCore Gateway 支持通过一次调用切换到新版本，但真正的升级工作不应止于修改版本号，还需要检查客户端状态、扩展依赖和授权边界。无状态意味着服务端不能再默认依赖先前请求留下的会话上...

# AI # AWS # Go

阅读全文

为 2026 PyTorch 大会设计一枚真正能被制造出来的 Flare Pin

2026-07-29 来源: pytorch.org 23

PyTorch Foundation 正在征集 2026 年 PyTorch Conference North America 的 flare pin 设计。获胜者将获得一张该大会的免费门票。对开发者和技术设计师来说，这不只是一次画图比赛：一枚合格的徽章既要传达 PyTorch 社区的气质，也要经得起缩小、制版和实体生产。会议徽章的展示面积有限。屏幕...

# AI # PyTorch # 机器学习

阅读全文

用 LangGraph、Strands 与 AgentCore 构建可恢复的市场监控多智能体系统

2026-07-29 来源: aws.amazon.com 14

市场监控不是一次简单的模型调用。一个生产系统需要持续接收行情与新闻，让不同智能体分别判断异常、核查证据、评估风险，并在任务中断后从最近状态继续执行。LangGraph、Strands 与 Amazon Bedrock AgentCore 的组合，正好对应这三个层次：LangGraph 管理确定性的工作流，Strands 承担智能体推理，AgentCor...

# AI # AWS # LLM

阅读全文

突破传统 RAG 上限：在 AWS 上构建任务感知知识压缩

2026-07-28 来源: aws.amazon.com 21

传统检索增强生成（RAG）擅长回答“哪份文档提到了这个术语”，但面对需要横跨数百份报告进行比较、归因和趋势分析的任务时，很快会碰到上下文窗口、检索召回率和推理成本的共同上限。任务感知知识压缩（Task-Aware Knowledge Compression，TAKC）换了一个切入点：不要等到查询到来后再临时拼接文档，而是围绕明确任务，提前把整个知识库压...

# AI # AWS # LLM

阅读全文

把 SageMaker AI 支持排障从数天缩短到数分钟：Deepgram 的 IAM 临时委派方案

2026-07-28 来源: aws.amazon.com 26

当 Deepgram 语音模型运行在客户自己的 Amazon SageMaker AI 环境中时，真正棘手的往往不是模型本身，而是支持工程师如何在不索取长期凭证、不过度开放权限的前提下，快速看到故障现场。 Deepgram 为此引入了基于 AWS IAM 的临时委派机制。按照其披露的结果，这项集成把 SageMaker AI 支持工单的初步调查时间从数...

# AI # AWS # 云平台

阅读全文

用 Amazon Nova 重构长期护理临床文档处理：从原始记录到可审计结构化数据

2026-07-28 来源: aws.amazon.com 20

长期护理机构每天会产生护理记录、交班摘要、病情变化说明等大量临床文档。Guardoc Health 的实践重点，是通过 Amazon Bedrock 调用 Amazon Nova 系列模型，把原本依赖人工阅读、摘录和整理的流程，转变为可扩展的文档处理管道。真正值得关注的并不只是生成一段摘要，而是如何让模型输出进入现有临床工作流，同时保持可追溯、可验证和...

# AI # AWS # 云平台

阅读全文

在 Amazon Bedrock 上接入 Claude Opus 5：面向 Agent 与生产推理的工程实践

2026-07-25 来源: aws.amazon.com 33

Claude Opus 5 的发布重点不只是模型能力提升，也包括如何把更强的 Opus 模型接入真实的 Agent 系统和生产推理流程。对于 AI 工程师来说，关键问题是如何在 Amazon Bedrock 上完成调用、控制延迟与成本，并让模型在多步骤任务中保持可观测、可恢复。在 Agent 场景中，模型通常需要连续完成任务拆解、工具选择、结果判断和...

# AI # AWS # LLM

阅读全文

在 AWS 上构建可解释的银行下一最佳产品推荐系统

2026-07-24 来源: aws.amazon.com 34

银行的下一最佳产品（Next-Best-Product，NBP）推荐，不能只追求点击率或转化率。模型需要同时处理客户画像、账户行为、产品属性和交互上下文，并且能对每一条推荐说明理由。基于 Amazon SageMaker AI、PyTorch、多塔神经网络和学习式注意力机制，可以把准确性与监管所需的可解释性放进同一条推荐链路。传统推荐模型常把所有特征...

# AI # AWS # PyTorch

阅读全文

在 Amazon Bedrock 上使用 GPT-5.6：从模型选择到 Codex 扩展

2026-07-24 来源: aws.amazon.com 40

OpenAI GPT-5.6 Sol、Terra 和 Luna 已在 Amazon Bedrock 正式可用。对开发团队来说，重点不只是换一个模型名称，而是要把模型选择、Responses API 调用、提示词缓存、Codex 接入和配额规划放进同一套工程流程里。 Sol、Terra 和 Luna 可以理解为面向不同工作负载的模型选项。实际选型时，不要...

# AI # AWS # LLM

阅读全文

用 Amazon Bedrock Guardrails 为代码生成工作流建立安全边界与容量规划

2026-07-24 来源: aws.amazon.com 18

代码助手面对的输入和输出与普通问答不同：提示词可能包含源代码、配置文件和内部接口信息，模型输出则可能直接进入代码评审、构建流水线甚至生产环境。Amazon Bedrock Guardrails 可以作为代码生成工作流中的独立安全层，用于拦截或标记不合规内容，同时帮助团队更准确地评估调用量、延迟和处理容量。关键不在于“给模型加一个过滤器”，而在于把 G...

# AI # AWS # LLM

阅读全文