标签

AWS

用 Amazon Nova Sonic 构建可扩展语音 Agent:多 Agent、工具调用与会话分段实战

来源:aws.amazon.com 27
语音 Agent 和文本 Agent 最大的区别不是"多了一个语音通道",而是延迟容忍度完全不同。文本对话里 2 秒的等待用户觉得正常,语音对话里超过 500ms 的沉默就会让人怀疑对方是不是掉线了。Amazon Nova Sonic、Bedrock AgentCore 和 Strands BidiAgent 这套组合,本质上是在解决一个工程问题:怎么...

用 MCP 服务器把 Kiro CLI 的对话记忆接入 Amazon Bedrock AgentCore Memory

来源:aws.amazon.com 14
Kiro CLI 让你在终端里直接和 AI 代理对话,但默认的对话记忆有限——关掉终端,上下文就丢了。Amazon Bedrock AgentCore Memory 是一个全托管服务,能让 AI 代理跨会话保留信息,对话越用越"懂你"。问题在于:两者之间没有现成的桥梁。这篇文章讲的是如何写一个自定义 MCP(Model Context Protocol...

用 SageMaker Feature Store 新能力加速 ML 特征管线

来源:aws.amazon.com 26
Amazon SageMaker Python SDK v3.8.0 带来了三项面向 Feature Store 的更新,直击特征工程管线里最拖节奏的环节:数据治理审批慢、表格式切换成本高、离线/在线同步配置繁琐。下面逐项拆解,并给出可以直接跑的代码。 过去往 Feature Store 写特征组,数据权限基本靠手动在 S3 和 Glue 上配 IAM...

Amazon Bedrock 上实现程序化工具调用的三种路径

来源:aws.amazon.com 32
模型能"说"要调用工具,但谁来真正执行代码、返回结果?Amazon Bedrock 近期推出的 Programmatic Tool Calling(PTC)把这个问题推到了开发者面前:你需要一个沙箱来安全地跑代码,再把输出喂回模型。选哪种沙箱方案,直接决定了你的控制粒度、运维成本和开发体验。 下面拆解三种实现方式——自建 ECS Docker 沙箱、B...

用 Amazon EKS 跑地质岩芯识别模型:ALS LITHOLENS 的工程实践

来源:aws.amazon.com 20
地质岩芯编录(core logging)是矿产勘探中最耗人力的环节之一——地质师需要逐段观察钻探取出的岩芯,记录岩性、结构、矿物含量,一条钻孔往往产生数百米样本,全靠肉眼和经验判断。ALS GeoAnalytics 的 LITHOLENS™ 把这件事交给机器学习:对岩芯高分辨率图像做自动识别与分类,大幅压缩编录时间,同时让结果更可复现。 但模型从实验室...

用异步帧生成流水线把 GPU 利用率从 82% 拉到 99.9%——视频推理加速实战

来源:aws.amazon.com 15
视频生成模型推理有一个老问题:VAE 解码器逐帧吐出画面,每帧都要从 GPU 搬到 CPU 做后处理(编码、封装),GPU 在等数据搬运完成的那段时间几乎是空转。Synthesia 与 AWS 合作在 EC2 G7e 实例上验证了一种叫 Asynchronous Frame Generation Pipeline 的方案,把 GPU 计算、设备到主机(...

用 Amazon Nova 2 Lite 做内容审核:结构化提示词实战与基准对比

来源:aws.amazon.com 39
内容审核是每个上线产品都要面对的问题——用户生成的文本、图片、视频里,哪些该拦、哪些该放,标准往往模糊且频繁变动。传统方案靠关键词匹配或小模型分类,维护成本高、泛化能力差。Amazon Nova 2 Lite 把大语言模型的理解能力直接用在审核环节:你只需要把审核规则写进提示词,模型就能按你的定义做判断。 这篇文章拆解两种提示词写法——结构化与自由式,...

用 Amazon Q 统一六套系统搜索、自动化文档流程——Aderant 的云运维实践

来源:aws.amazon.com 16
法律行业软件公司 Aderant 运维团队每天要跨六套不同供应商系统查信息、写文档:工单在 ServiceNow,知识库在 Confluence,代码在 GitHub,资产台账在另一套 CMDB……搜索一个问题的完整上下文,往往要手动跳转多个平台,耗时数分钟甚至更久。文档编写更是重复劳动——同样的变更记录,要在不同系统里各写一遍。 他们用 Amazon...

把 Confluence 知识库接入 Amazon Q:语义搜索与自动化操作实战

来源:aws.amazon.com 27
企业内部最重的知识资产往往躺在 Confluence 里——项目文档、运维手册、决策记录,几百上千页,靠标题和标签翻找越来越像大海捞针。Amazon Q Business(下文简称 Q)提供了语义搜索和 Actions 机制,能把 Confluence 从"被动存档"变成"主动回答"。这篇文章走一遍完整接入流程:建知识库、配 Actions、用 Spa...

用 Amazon Bedrock AgentCore 自建代码级评估器:从金融情报 Agent 的四个实战案例说起

来源:aws.amazon.com 32
金融市场的 AI Agent 一旦上线,回答质量直接关系到交易决策和合规风险。Amazon Bedrock AgentCore 最近开放了自定义代码评估器(custom code-based evaluator)能力,让你可以用 Lambda 函数对 Agent 输出做细粒度、可编程的质检——不再只能依赖内置的通用指标。 这篇文章围绕一个金融市场情报 ...