AI 精选工程笔记

技术摘要

AI 精选与摘要技术文章、编程实践和人工智能新闻。

---

用 SFT + DPO 双阶段训练，让小模型的工具调用不再"胡说八道"

2026-06-03 来源: aws.amazon.com 34

大模型做 Agent 时，最让人头疼的不是推理能力不够，而是工具调用不准——该调 API 时不调，不该调时瞎调，参数拼错、格式乱写，整个工作流直接断掉。Amazon SageMaker AI 最近的一篇实践文章给出了一个清晰的解法：先用监督微调（SFT）教会模型"怎么正确调用工具"，再用直接偏好优化（DPO）让它学会"哪种调用方式更好"，两步叠加，小语...

# AI # AWS # LLM

阅读全文

用 Amazon FSx for NetApp ONTAP 搭建高可用 Oracle 数据库

2026-06-03 来源: aws.amazon.com 34

Oracle 数据库的高可用架构，核心难题一直是共享存储。传统做法依赖 SAN 或 NFS，在云上要么成本高，要么恢复慢。Amazon FSx for NetApp ONTAP（简称 FSxN）把 ONTAP 的数据管理能力搬进 AWS，配合 Auto Scaling 和无服务器编排，可以把故障恢复从"人肉重启"压缩到分钟级自动化。下面拆解这套架构的...

# AI # AWS # LLM

阅读全文

写代码不再是瓶颈：Spotify 如何把开发者体验扩展到团队与 AI Agent

2026-06-03 来源: engineering.atspotify.com 36

Spotify 首席架构师在 Code with Claude 大会上抛出一个判断：写代码本身已经不再是约束了。真正卡住交付速度的，是团队协作摩擦、重复的基建搭建、以及工具链对 AI Agent 的不友好。他们的应对方式是——用平台工程把开发者体验（DevEx）从"个人写代码"的维度，拉升到"团队+Agent 高效运转"的维度。这个判断值得认真对待。...

# AI # LLM # Spotify

阅读全文

DeepSpeed 正式集成 Muon 优化器：从原理到上手配置

2026-06-03 来源: pytorch.org 19

Muon 优化器在过去几个月里迅速获得了前沿 AI 实验室的青睐——Moonshot AI 等团队已经在大规模训练中采用它。现在 DeepSpeed 完成了对 Muon 的原生支持，意味着用 DeepSpeed 做分布式训练的开发者可以直接在配置文件里切换到这个优化器，不再需要自己魔改训练循环。传统 AdamW 对每个参数维护一阶动量和二阶动量（逐元...

# AI # PyTorch # 机器学习

阅读全文

Google 全球服务舰队上的大规模 A/B 实验系统：如何让分布式实验不再打架

2026-06-03 来源: infoq.com 30

Google 每天同时跑着成千上万个 A/B 实验——搜索、YouTube、Maps、Ads，每个产品都有自己的服务集群，每个集群又拆成几十个微服务。实验多了，问题就来了：用户在搜索页被分到实验 A，跳到结果页却被分到实验 B；曝光日志漏记了一条，结论就偏了；两个实验同时改同一个按钮的颜色，数据谁也说不清。最近 Google 公开了它跨舰队的大规模 ...

# AI # Go # InfoQ

阅读全文

Paozhu 1.10.0：C++ Web 框架补上 WebSocket 客户端与 RPC，物联网场景终于有了一站式选择

2026-06-03 来源: oschina.net 24

做 C++ 后端开发的人大概都经历过这种割裂：HTTP 框架选一个，WebSocket 再找另一个，RPC 又得引入第三方库，物联网场景下的裸 Socket 通信还得自己从 epoll 写起。Paozhu 这个国产 C++ Web 框架在 1.10.0 版本里一口气把这些缺口补上了——WebSocket client、Socket server/cli...

# 全栈 # 前端 # 后端

阅读全文

GitHub Copilot 代码审查实战：让 AI 帮你审 PR

2026-06-03 来源: realpython.com 27

代码审查是团队协作里最耗时间的环节之一——一个中等规模的 PR，人工审完往往要半小时到一小时，而审查者还可能漏掉风格不一致、潜在安全风险这类细节。GitHub Copilot Code Review 把 AI 拉进了审查流程：它能在 PR 提交后自动给出反馈、指出问题，甚至生成一键修复的代码建议。下面看看怎么把它用起来，以及如何用自定义指令让它真正适配...

# AI # Python # 后端

阅读全文

GPT-Rosalind 新能力上线：让 AI 真正读懂生命科学

2026-06-03 来源: openai.com 36

生命科学研究的瓶颈往往不在数据量——测序仪和质谱仪每天都在吐出海量数据——而在把数据变成可行动的生物学判断。GPT-Rosalind 这一轮更新瞄准的就是这个缺口：生物推理、药物化学、基因组学分析、实验流程规划，四个方向同时加码。下面逐个拆开看，并给出可以直接上手用的示例。普通大模型可以背诵"BRCA1 是抑癌基因"，但遇到"为什么 BRCA1 突变...

# AI # LLM # OpenAI

阅读全文

GitHub Copilot 代码审查实战：在 Pull Request 中用好自动审查与自定义指令

2026-06-03 来源: realpython.com 23

GitHub Copilot 的代码审查功能已经从"实验性标签"走向正式可用。它能在 PR 提交时自动生成审查意见，也支持你通过自定义指令（custom instructions）引导审查方向，而不是被动接受通用建议。这篇文章把关键配置和实操要点梳理清楚，帮你把 Copilot Review 从"偶尔看看"变成日常流程的一部分。 Copilot Cod...

# Python # 后端

阅读全文

Wasmer 用 Codex 加速 10–20 倍，几周交付一个 Edge Node.js 运行时

2026-06-03 来源: openai.com 24

在边缘计算场景下跑 Node.js，长期是个硬骨头——V8 体积大、冷启动慢、模块兼容性碎。Wasmer 团队最近用 OpenAI Codex（搭配 GPT-5.5）从零搭建了一个面向 edge 的 Node.js runtime，开发速度提升 10 到 20 倍，原本需要数月的工程压缩到几周交付。这件事值得拆开看：不只是"AI 写代码快"，而是整个工...

# AI # LLM # OpenAI

阅读全文