AI 精选工程笔记

技术摘要

AI 精选与摘要技术文章、编程实践和人工智能新闻。

---

用 SFT + DPO 双阶段训练,让小模型的工具调用不再"胡说八道"

来源: aws.amazon.com 34
大模型做 Agent 时,最让人头疼的不是推理能力不够,而是工具调用不准——该调 API 时不调,不该调时瞎调,参数拼错、格式乱写,整个工作流直接断掉。Amazon SageMaker AI 最近的一篇实践文章给出了一个清晰的解法:先用监督微调(SFT)教会模型"怎么正确调用工具",再用直接偏好优化(DPO)让它学会"哪种调用方式更好",两步叠加,小语...

用 Amazon FSx for NetApp ONTAP 搭建高可用 Oracle 数据库

来源: aws.amazon.com 34
Oracle 数据库的高可用架构,核心难题一直是共享存储。传统做法依赖 SAN 或 NFS,在云上要么成本高,要么恢复慢。Amazon FSx for NetApp ONTAP(简称 FSxN)把 ONTAP 的数据管理能力搬进 AWS,配合 Auto Scaling 和无服务器编排,可以把故障恢复从"人肉重启"压缩到分钟级自动化。 下面拆解这套架构的...

写代码不再是瓶颈:Spotify 如何把开发者体验扩展到团队与 AI Agent

来源: engineering.atspotify.com 36
Spotify 首席架构师在 Code with Claude 大会上抛出一个判断:写代码本身已经不再是约束了。真正卡住交付速度的,是团队协作摩擦、重复的基建搭建、以及工具链对 AI Agent 的不友好。他们的应对方式是——用平台工程把开发者体验(DevEx)从"个人写代码"的维度,拉升到"团队+Agent 高效运转"的维度。 这个判断值得认真对待。...

DeepSpeed 正式集成 Muon 优化器:从原理到上手配置

来源: pytorch.org 19
Muon 优化器在过去几个月里迅速获得了前沿 AI 实验室的青睐——Moonshot AI 等团队已经在大规模训练中采用它。现在 DeepSpeed 完成了对 Muon 的原生支持,意味着用 DeepSpeed 做分布式训练的开发者可以直接在配置文件里切换到这个优化器,不再需要自己魔改训练循环。 传统 AdamW 对每个参数维护一阶动量和二阶动量(逐元...

Google 全球服务舰队上的大规模 A/B 实验系统:如何让分布式实验不再打架

来源: infoq.com 30
Google 每天同时跑着成千上万个 A/B 实验——搜索、YouTube、Maps、Ads,每个产品都有自己的服务集群,每个集群又拆成几十个微服务。实验多了,问题就来了:用户在搜索页被分到实验 A,跳到结果页却被分到实验 B;曝光日志漏记了一条,结论就偏了;两个实验同时改同一个按钮的颜色,数据谁也说不清。 最近 Google 公开了它跨舰队的大规模 ...

Paozhu 1.10.0:C++ Web 框架补上 WebSocket 客户端与 RPC,物联网场景终于有了一站式选择

来源: oschina.net 24
做 C++ 后端开发的人大概都经历过这种割裂:HTTP 框架选一个,WebSocket 再找另一个,RPC 又得引入第三方库,物联网场景下的裸 Socket 通信还得自己从 epoll 写起。Paozhu 这个国产 C++ Web 框架在 1.10.0 版本里一口气把这些缺口补上了——WebSocket client、Socket server/cli...

GitHub Copilot 代码审查实战:让 AI 帮你审 PR

来源: realpython.com 27
代码审查是团队协作里最耗时间的环节之一——一个中等规模的 PR,人工审完往往要半小时到一小时,而审查者还可能漏掉风格不一致、潜在安全风险这类细节。GitHub Copilot Code Review 把 AI 拉进了审查流程:它能在 PR 提交后自动给出反馈、指出问题,甚至生成一键修复的代码建议。下面看看怎么把它用起来,以及如何用自定义指令让它真正适配...

GPT-Rosalind 新能力上线:让 AI 真正读懂生命科学

来源: openai.com 36
生命科学研究的瓶颈往往不在数据量——测序仪和质谱仪每天都在吐出海量数据——而在把数据变成可行动的生物学判断。GPT-Rosalind 这一轮更新瞄准的就是这个缺口:生物推理、药物化学、基因组学分析、实验流程规划,四个方向同时加码。下面逐个拆开看,并给出可以直接上手用的示例。 普通大模型可以背诵"BRCA1 是抑癌基因",但遇到"为什么 BRCA1 突变...

GitHub Copilot 代码审查实战:在 Pull Request 中用好自动审查与自定义指令

来源: realpython.com 23
GitHub Copilot 的代码审查功能已经从"实验性标签"走向正式可用。它能在 PR 提交时自动生成审查意见,也支持你通过自定义指令(custom instructions)引导审查方向,而不是被动接受通用建议。这篇文章把关键配置和实操要点梳理清楚,帮你把 Copilot Review 从"偶尔看看"变成日常流程的一部分。 Copilot Cod...

Wasmer 用 Codex 加速 10–20 倍,几周交付一个 Edge Node.js 运行时

来源: openai.com 24
在边缘计算场景下跑 Node.js,长期是个硬骨头——V8 体积大、冷启动慢、模块兼容性碎。Wasmer 团队最近用 OpenAI Codex(搭配 GPT-5.5)从零搭建了一个面向 edge 的 Node.js runtime,开发速度提升 10 到 20 倍,原本需要数月的工程压缩到几周交付。这件事值得拆开看:不只是"AI 写代码快",而是整个工...