标签

机器学习

用 Strands 搭建智能研究助手:从想法到可运行的 AI 应用

来源:aws.amazon.com 32
把一个"让 AI 帮我查资料、整理摘要"的想法落地,听起来简单——调几个 API、拼几段 prompt 就行。但真正动手时你会发现:多轮对话的状态管理、工具调用的编排、错误重试、上下文窗口控制……每一项都能把一个周末项目拖成几个月的工程。Strands 的思路是:把这些重复的基建工作收进框架层,让开发者把精力放在"我的助手要做什么"而不是"怎么把 AP...

千人级 AI 平台的可观测性:如何看清谁在用、用得好不好

来源:aws.amazon.com 27
当企业 AI 平台从几十人试点扩展到上千人日常使用时,平台 owner 面对的核心问题变了——不再是"能不能跑起来",而是"谁在用、用得怎样、哪些能力最被需要"。这些数据散落在 CloudTrail 日志、CloudWatch 指标、S3 对话记录和 QuickSight 报表里,没有统一的视角,决策就只能靠猜。 这篇文章拆解一套面向 Amazon Q...

Amazon Quick:把文档和可视化从数小时压缩到数分钟

来源:aws.amazon.com 33
每周写周报、做数据可视化、整理项目复盘——这些"低技术含量却高耗时"的任务,悄悄吞噬了专业工作者大量时间。Amazon Quick 的核心承诺很简单:把文档生成和可视化创建从手工拼装变成意图驱动的自动产出,让你从"执行排版"回到"做判断"。 大多数专业角色都有一个不成文的假设:你应该花相当一部分时间在格式调整、图表配色、数据搬运上。结果是—— 一份季度...

TLX Block Attention:为 Blackwell 架构量身定制的块稀疏注意力内核

来源:pytorch.org 25
大模型推理和训练的算力瓶颈,很大一部分卡在 self-attention 的 O(n²) 复杂度上。块对角稀疏(block-diagonal sparse)注意力是一种实用的压缩策略——只在固定大小的对角块内计算注意力,其余位置直接跳过。问题在于:现有内核多为通用稀疏注意力设计,没有针对固定块模式做编译期优化,更没有利用新一代 GPU 的硬件特性。 M...

PyTorch 基金会大使计划:从社区贡献者到全球技术布道者

来源:pytorch.org 35
一年前,PyTorch 基金会正式推出 Ambassador Program——这不是又一个挂名的荣誉头衔,而是对社区中那些持续输出内容、组织活动、帮助他人解决问题的独立技术声音的系统性支持。如果你曾在本地 Meetup 上讲过 PyTorch、写过教程、在论坛里反复回答新手问题,这个计划就是为你准备的。 PyTorch 基金会的大使计划核心目标很明确...

Amazon Nova Act 获得 HIPAA 合规资质:医疗场景下的 Agentic AI 终于可以落地了

来源:aws.amazon.com 24
医疗行业对 AI 的态度一直很矛盾——既渴望自动化带来的效率提升,又对数据合规心存忌惮。Agentic AI(能自主执行操作的 AI)尤其敏感:它不只是生成文本,还要读取页面、点击按钮、提交表单,每一步都可能触碰受保护的健康信息(PHI)。Amazon Nova Act 现在拿到了 HIPAA 合规资质,意味着在医疗场景中使用 Agentic AI 不...

用 AI Agent 动态调度放射科工作流,终结"挑拣病例"顽疾

来源:aws.amazon.com 26
62 家医院、220 万次影像检查的数据揭示了一个长期被忽视的问题:放射科医生在传统工作列表里疯狂"薅羊毛"——抢着读简单、高回报的病例,把复杂研究丢在队列里烂掉。这不是医生懒,是系统蠢。基于硬编码规则的工作列表完全无视医生专长、当前负荷、疲劳程度和病例复杂度,等于把一个需要动态决策的调度问题交给了静态路由表。AI Agent 的介入,正在把这张僵化的...

用 Bedrock AgentCore Runtime 把自然语言变成 AWS CLI——AWS API MCP Server + Amazon Quick 实战

来源:aws.amazon.com 35
运维和开发最怕的不是命令难写,而是关键时刻要切工具。凌晨两点排查故障,你脑子里想的是"把那个 ECS 服务的任务数缩到 1",手上却要先开终端、翻文档、拼 CLI 参数、确认 region——整个过程断断续续,注意力被工具切换撕碎。 Amazon Bedrock AgentCore Runtime 现在支持了 Model Context Protoco...

用 Amazon Bedrock AgentCore 构建多租户智能体:隔离、配置与落地实践

来源:aws.amazon.com 31
当你的 AI Agent 从内部工具走向 SaaS 产品,租户隔离就成了架构的第一道门槛。单租户场景下,Agent 共享同一个知识库、同一套工具权限、同一个上下文窗口,一切都很简单。但一旦多个客户接入,问题立刻浮现:A 客户的订单数据不能被 B 客户的 Agent 读到;不同客户对同一工具的调用策略可能完全不同;按租户计费和限流也需要精确到每个 ten...

用递归语言模型突破上下文窗口限制:Amazon Bedrock AgentCore 实战

来源:aws.amazon.com 38
大模型的上下文窗口一直在增长——128K、256K、甚至 1M tokens——但现实中的文档处理需求增长更快。一份年度财报、一套完整法规修订稿、一个大型代码仓库的跨模块审计,轻松就能超出任何单次调用的承载能力。Amazon Bedrock AgentCore 结合 Strands Agents SDK 提出了一种新思路:递归语言模型(Recursiv...