标签

机器学习

十万车队用户的 Agentic AI:Verizon Connect 如何把数据洪流变成可执行洞察

来源:aws.amazon.com 29
车队管理每天产生的数据量令人窒息——GPS 定位、油耗、驾驶行为、维保记录、路线偏离,一个中型车队一天就能堆出百万级事件。对运营人员来说,看仪表盘已经不够了,他们需要的是"下一步该做什么"。Verizon Connect 用 Agentic AI 把这个问题从"看数据"推进到"拿洞察",并把它稳定地推给了十万日活用户。这篇文章拆解他们走过的架构决策、实...

PyTorch Compile 为什么能快这么多:内核融合的秘密

来源:pytorch.org 13
给模型加上一行 ,推理速度有时能飙升数倍甚至十倍。这背后不是魔法,而是 GPU 执行模型的一个根本性优化——内核融合(Kernel Fusion)。理解它,你才能判断什么时候该用 compile、什么时候它帮不上忙,以及如何写出更容易被融合的代码。 PyTorch 的 eager 模式下,每遇到一个算子,框架就向 GPU 发射一个 kernel——一段...

用 Bedrock AgentCore 搭建企业级对话式 BI 助手:AWS SMGS 的 NarrateAI 实战拆解

来源:aws.amazon.com 30
AWS 内部的 Sales, Marketing and Global Services(SMGS)组织每天要处理海量业务数据——销售管线、营销 ROI、全球服务工单,数据散落在数十个系统里。传统 BI 仪表盘能看数,但没法"对话"。SMGS 团队用 Amazon Bedrock AgentCore 搭了 NarrateAI,让业务人员直接用自然语言提...

20 个销售 Agent 各自为战,谁来替用户做调度?

来源:aws.amazon.com 23
AWS 全球销售团队部署了超过 20 个领域专用 AI Agent——报价计算、客户画像、合同审查、竞品分析……每个 Agent 都能独立产出价值,但一线销售代表却要在不同系统间反复切换,自己判断"这个问题该找谁"。认知负荷没有减少,反而从"查资料"变成了"选 Agent"。Amazon Bedrock AgentCore 正是为解决这类编排问题而生:...

TokenSpeed 把 Qwen3.5-397B-A17B 推到 580 TPS:消灭内存拷贝的推理加速实战

来源:pytorch.org 25
大模型推理的瓶颈,很多时候不在算力,而在搬运。TokenSpeed 在 GPU 上跑 Qwen3.5-397B-A17B(397B 总参数、17B 活跃参数的 MoE 架构)冲到 580 tokens/s,核心思路就一条:系统性地消灭每一处不必要的内存拷贝。对做 Agentic 工作流的团队来说,这意味着长上下文、多轮工具调用的场景终于有了不卡顿的 G...

阿里云成为 PyTorch 基金会铂金会员:对开发者意味着什么

来源:pytorch.org 13
PyTorch 基金会今天宣布阿里云以铂金会员身份加入。铂金意味着每年至少 25 万美元的赞助投入,以及在技术指导委员会中拥有席位。这不是一张"赞助证书",而是阿里云要实质性地参与 PyTorch 的路线图制定和基础设施建设。对日常用 PyTorch 训练模型的开发者来说,这件事的影响会比想象中更具体。 加入基金会之前,阿里云并非旁观者。几个已经落地的...

Amazon Bedrock AgentCore Payments:让 AI Agent 的每一笔微交易都可控、可付

来源:aws.amazon.com 22
当 AI Agent 开始自主调用外部 API——查天气、买数据、调用翻译服务——谁来付钱、怎么付、付多少,立刻变成工程问题。传统做法是每个服务商单独签约、配置 API Key 和账单,Agent 调一次就要人工对接一次,成本和摩擦随服务数量线性增长。Amazon Bedrock AgentCore Payments 正是为解决这个问题而生的支付基础设...

用 LangGraph + Bedrock AgentCore 在 AWS 上搭一套可扩展的无服务器多智能体系统

来源:aws.amazon.com 28
多智能体系统正从"实验性 demo"走向"生产级服务",但真正让人头疼的不是编排逻辑本身,而是两件事:状态怎么持久化,以及调用链怎么追踪。AWS 最近推出的 Amazon Bedrock AgentCore 正好瞄准了这两个痛点——它把 Memory 和 Observability 做成了托管服务,而 LangGraph 则提供了灵活的有状态图编排能力...

用 Strands Agents + NVIDIA NIM + Bedrock AgentCore 搭建高性能多 Agent 系统

来源:aws.amazon.com 15
单 Agent 能解决很多问题,但一旦任务涉及并行推理、上下文共享和执行可追溯,单线程的调用链就撑不住了。AWS 近期发布的集成方案把三个组件拼成了一条完整链路:Strands Agents 负责多 Agent 无服务器编排,NVIDIA NIM 提供 GPU 加速推理端点,Amazon Bedrock AgentCore 托管运行时、共享记忆和可观测...

AgentWatch:让 AWS 监控从被动告警变成主动巡检

来源:aws.amazon.com 21
凌晨三点,CloudWatch 告警响了。你爬起来打开控制台,发现 CPU 利用率飙升——但到底是哪台实例、哪个服务、哪条日志链路出了问题?你需要跨账号翻指标、查日志、看告警历史,十五分钟后才拼出完整故事。 AgentWatch 把这个流程反过来:不是等告警触发再追查,而是每 15 分钟主动巡检,把 CloudWatch 指标、日志和告警跨账号汇总成一...