AI 精选工程笔记

技术摘要

AI 精选与摘要技术文章、编程实践和人工智能新闻。

---

Next.js 16.2：开发启动提速 4 倍，渲染快 60%，还给 AI Agent 开了新门

2026-06-04 来源: infoq.com 33

Vercel 刚发布 Next.js 16.2，三个数字直接拉满注意力：开发服务器启动速度提升 400%，页面渲染快了 60%，以及一套面向 AI Agent 的开发工具链。如果你还在用 Next.js 15，这次升级的性价比很高——迁移路径已经铺好，门槛只是 Node.js 20.9 和 TypeScript 5.1。 400% 的启动提速不是魔法，...

# AI # InfoQ # LLM

阅读全文

WinUI 去掉了"3"——微软终于说清楚：Windows 原生应用才是正途

2026-06-04 来源: oschina.net 22

Build 2026 上，微软软件工程副总裁 Chris Anderson 说了一句开发者等了多年的话："我们无意构建新框架。"伴随这句话落地的还有一个更直观的变化——WinUI 3 的品牌名称正式被放弃，今后只叫 WinUI。少一个数字，多一份确定性。过去几年，Windows 原生 UI 框架的命名一直在变：WinUI 2 是 UWP 时代的 X...

# 全栈 # 前端 # 开源

阅读全文

大众点评 M 站 Qwik.js 重构：用可恢复性干掉水合开销

2026-06-04 来源: tech.meituan.com 36

站外页面是用户第一次接触大众点评的入口——从微信分享、搜索引擎到短视频跳转，每一毫秒的加载延迟都在直接流失转化。增长团队面对的现实很骨感：旧 M 站基于传统 SSR + 水合架构，首屏可交互时间被框架自身的 hydration 拖累，维护成本也随着业务膨胀居高不下。引入 Qwik.js 重构后，团队用"可恢复性"替代了水合，配合全链路工程优化，各核心页...

# 全栈 # 前端 # 工程实践

阅读全文

美团如何用指标平台统一数据口径、加速查询——新一代 BI 架构实践

2026-06-04 来源: tech.meituan.com 25

业务越做越大，报表越建越多，数据口径却越来越乱——这是很多公司数据团队的共同痛点。美团数据平台也踩过同样的坑：个性化数据集驱动下，不同团队各自建表、各自定义指标，同一笔 GMV 在三份报表里出现三个数字，查询性能还因为重复计算和宽表膨胀一路下滑。他们的解法不是再加一层报表治理流程，而是从架构层面重构——以指标平台为核心，建设自动语义和增强计算两种能力...

# 全栈 # 工程实践 # 架构设计

阅读全文

LongCat-Next 开源：视觉和语音不再需要"翻译"给文本

2026-06-04 来源: tech.meituan.com 27

过去两年，多模态模型的常见做法是让图像和音频先过一道"翻译"——视觉编码器把图片压缩成向量，语音模型把声音转成文本，再喂给语言模型做推理。翻译过程不可避免地丢信息：一张图里的空间关系、一段语音里的情绪起伏，经过压缩后只剩模糊的摘要。美团团队发布的 LongCat-Next 走了一条不同的路：让视觉和语音直接成为模型的"母语"，与文本在同一个词元空间里...

# AI # 全栈 # 工程实践

阅读全文

从"猜对答案"到"证得严密"：LongCat-Flash-Prover 如何让 AI 真正学会数学证明

2026-06-04 来源: tech.meituan.com 18

让大模型做一道高中代数题，它大概率能算出正确答案。但把同样的问题换成"请证明这个结论对所有自然数成立"，事情就完全不同了——答案对了不够，每一步推理都必须经得起形式化逻辑的逐行审查，一个模糊的"显然"就能让整条证明链断裂。LongCat-Flash-Prover 正是为这个更难的问题而开源的模型：它不满足于"猜答案"，而是要把 AI 推向严谨的形式化定...

# AI # 全栈 # 工程实践

阅读全文

LongCat-AudioDiT：扔掉梅尔谱，直接在波形潜空间做扩散 TTS

2026-06-04 来源: tech.meituan.com 35

零样本语音克隆一直有个绕不开的痛点——级联误差。从文本到梅尔谱，梅尔谱到声码器波形，每一步转换都在丢信息、叠噪声。美团 LongCat 团队刚发布的 LongCat-AudioDiT，选择了一条更激进的路：把梅尔谱这类中间表示彻底砍掉，直接在波形潜空间里跑扩散模型生成语音。这意味着整条生成链路少了一整段"翻译"环节，误差累积的根源被从中间掐断。传统 ...

# AI # 全栈 # 工程实践

阅读全文

LARYBench：从人类视频学动作表征，通用视觉模型竟然碾压动作专家

2026-06-04 来源: tech.meituan.com 36

具身智能领域有个长期隐痛：机器人需要理解"动作"，但高质量的动作数据极度稀缺。于是大家把目光投向 YouTube 上海量的人类操作视频——做饭、组装、打扫，这些视频里藏着丰富的动作语义。问题是，从这些"旁观视角"的视频里学到的表征，到底能不能迁移到机器人的控制上？LARYBench 第一次给出了系统化的答案，而且结论出乎意料：通用视觉模型的动作表征，在...

# AI # 全栈 # 工程实践

阅读全文

AI写了90%的代码，谁来守住底线——31万行重构的约束实践

2026-06-04 来源: tech.meituan.com 36

当仓库里超过九成代码由 AI 生成，决定系统走向的不再是"谁写得更快"，而是"谁能约束 AI 的输出"。没有统一规范，AI 只会成倍放大混乱——命名不一致、架构漂移、重复抽象层层叠加，技术债不是线性增长，而是指数膨胀。我们用 31 万行代码的重构实践验证了一个思路：把 Agent 评测的方法论搬到 AI Coding 管理上，通过技术债盘点、Rule...

# AI # LLM # 全栈

阅读全文

Subtitle Edit 4.0.16：多格式字幕编辑的老牌工具再更新

2026-06-04 来源: oschina.net 27

做视频的人大概都踩过字幕的坑——编码乱码、格式不兼容、时间轴偏移几秒整段对不上。Subtitle Edit 从 2001 年就开始啃这些问题，4.0.16 是这条路上的又一个维护版本。虽然更新日志看起来平淡（翻译更新、小修复），但工具本身值得重新认识，尤其是它覆盖的八种字幕格式和编码处理能力。 Subtitle Edit 支持的字幕格式覆盖了从早期 D...

# AI # 全栈 # 开源

阅读全文