2026-05-21
来源:aws.amazon.com
31
用 OpenAI SDK 或 LangChain 调大模型,是很多团队的标准做法。问题在于:一旦想把模型迁到 AWS SageMaker AI 上托管,就得写 SigV4 签名、换客户端、改调用逻辑——迁移成本不小。今天 SageMaker AI 正式推出了 OpenAI-compatible API 支持,实时推理端点直接暴露 这类接口,OpenAI...
2026-05-21
来源:postgr.es
23
做数据分析的人迟早会遇到一个需求:把连续数值分到几个区间里——年龄分段、消费分层、响应时间分桶。Excel 里拖几下就完事了,到了 PostgreSQL 就得靠 。这个函数本身并不复杂,但围绕它的"轻量级灾难"反复上演:一位数据分析师朋友最近又踩了同样的坑,Kaarel Moppel 决定把经验写下来,免得后人继续在暗处摸索。 的等宽分桶签名是: 逻辑...
2026-05-21
来源:djangoproject.com
27
Django 6.1 的第一个 alpha 版已经上架 PyPI。这个版本的意义不只是"又发了一个新包"——它标志着 6.1 的功能冻结(feature freeze),也就是说,后续 beta 和 RC 阶段只会修 bug 和做兼容性调整,不会再塞新功能了。如果你想在 6.1 正式版出来之前提前踩坑或贡献反馈,现在就是最好的窗口期。 当前公布的节奏大...
2026-05-21
来源:aws.amazon.com
18
你做了一个发票识别模型,它返回"总金额:¥12,580"。数字看着合理,格式也没问题——但你怎么知道它真的从图片里读出来的,而不是"猜"的? 文本评估器回答不了这个问题。它只能比对输出和参考答案的字符串相似度,无法判断模型输出是否忠实于源图像。这正是 Strands Evals 引入 MLLM-as-a-judge(多模态大模型做裁判)的原因:让评估器...
2026-05-21
来源:aws.amazon.com
30
语音代理、实时字幕、呼叫中心分析、无障碍辅助工具——这些场景的共同底座是实时语音转文字(streaming speech-to-text)。用户一边说话,系统一边出结果,整条链路跑在一条持久连接上,延迟必须压到毫秒级。 传统推理模式在这里直接卡壳:请求-响应架构要求音频全部收齐后才开始推理,等一段 10 秒的录音传完再出结果,体验已经崩了。Amazon...
2026-05-21
来源:azure.microsoft.com
32
云上的性能瓶颈,往往不在 CPU 核数或内存大小本身,而在于计算、存储、网络三者之间的配合是否紧密。Azure 近期在 IaaS 层面推动的"系统级思路",核心就是一句话:别把 VM、磁盘、虚拟网络当成独立零件采购,而是把它们当作一个整体系统来设计。 这对跑 AI 训练、云原生微服务、关键业务数据库的团队尤其重要——单资源再强,如果网络吞吐跟不上磁盘 ...
2026-05-20
来源:pytorch.org
21
PyTorch Docathon 2026 刚落下帷幕,社区交出了 150+ 已合并 PR 的成绩单。一场围绕文档的冲刺活动,能吸引这么多人持续投入,本身就说明一件事——PyTorch 的文档痛点真实存在,而修复它的门槛比很多人想象的要低。 PyTorch 的 API 数量庞大,从 到 ,从 eager mode 到 TorchScript、torch...
2026-05-20
来源:infoq.com
30
数据仓库平台团队最头疼的事不是写新功能,而是日复一日回答"这个查询为什么慢""表为什么没更新""权限怎么配"。Grab 的 Central Data Team 也被这类重复性支持请求拖住了手脚,直到他们用多 Agent AI 系统把调查和优化两类工作拆开、交给专门的 Agent 处理,才把工程师的时间从"灭火"拉回到真正的平台建设上。 Grab 的数据...
2026-05-20
来源:infoq.com
29
数据平台团队最头疼的不是技术难题,而是日复一日的重复性支持请求:表权限报错、管道延迟、数据质量异常……这些工单把工程师拖进"救火循环",真正该做的平台基建工作反而被挤到角落。Grab 的 Central Data Team 用一套多智能体系统把这类重复任务自动化,让工程师的精力重新回到平台建设上。 数据仓库平台一旦服务数百个业务团队,支持请求的量级会迅...
2026-05-20
来源:oschina.net
15
5 月 19 日,安全公司 StepSecurity 和 SafeDep 同时发出警告:一场针对 npm 生态的大规模供应链攻击正在进行。攻击者入侵了热门开源项目维护者的账户,在短短 20 分钟内向 317 个 npm 包推送了超过 630 个恶意版本。这场攻击被研究人员命名为 "Mini Shai-Hulud"——它是此前更大规模 Shai-Hulu...