AI 精选工程笔记

技术摘要

AI 精选与摘要技术文章、编程实践和人工智能新闻。

---

Next.js 16.2:开发启动提速 4 倍,渲染快 60%,还给 AI Agent 开了新门

来源: infoq.com 33
Vercel 刚发布 Next.js 16.2,三个数字直接拉满注意力:开发服务器启动速度提升 400%,页面渲染快了 60%,以及一套面向 AI Agent 的开发工具链。如果你还在用 Next.js 15,这次升级的性价比很高——迁移路径已经铺好,门槛只是 Node.js 20.9 和 TypeScript 5.1。 400% 的启动提速不是魔法,...

WinUI 去掉了"3"——微软终于说清楚:Windows 原生应用才是正途

来源: oschina.net 22
Build 2026 上,微软软件工程副总裁 Chris Anderson 说了一句开发者等了多年的话:"我们无意构建新框架。"伴随这句话落地的还有一个更直观的变化——WinUI 3 的品牌名称正式被放弃,今后只叫 WinUI。 少一个数字,多一份确定性。 过去几年,Windows 原生 UI 框架的命名一直在变:WinUI 2 是 UWP 时代的 X...

大众点评 M 站 Qwik.js 重构:用可恢复性干掉水合开销

来源: tech.meituan.com 36
站外页面是用户第一次接触大众点评的入口——从微信分享、搜索引擎到短视频跳转,每一毫秒的加载延迟都在直接流失转化。增长团队面对的现实很骨感:旧 M 站基于传统 SSR + 水合架构,首屏可交互时间被框架自身的 hydration 拖累,维护成本也随着业务膨胀居高不下。引入 Qwik.js 重构后,团队用"可恢复性"替代了水合,配合全链路工程优化,各核心页...

美团如何用指标平台统一数据口径、加速查询——新一代 BI 架构实践

来源: tech.meituan.com 25
业务越做越大,报表越建越多,数据口径却越来越乱——这是很多公司数据团队的共同痛点。美团数据平台也踩过同样的坑:个性化数据集驱动下,不同团队各自建表、各自定义指标,同一笔 GMV 在三份报表里出现三个数字,查询性能还因为重复计算和宽表膨胀一路下滑。 他们的解法不是再加一层报表治理流程,而是从架构层面重构——以指标平台为核心,建设自动语义和增强计算两种能力...

LongCat-Next 开源:视觉和语音不再需要"翻译"给文本

来源: tech.meituan.com 27
过去两年,多模态模型的常见做法是让图像和音频先过一道"翻译"——视觉编码器把图片压缩成向量,语音模型把声音转成文本,再喂给语言模型做推理。翻译过程不可避免地丢信息:一张图里的空间关系、一段语音里的情绪起伏,经过压缩后只剩模糊的摘要。 美团团队发布的 LongCat-Next 走了一条不同的路:让视觉和语音直接成为模型的"母语",与文本在同一个词元空间里...

从"猜对答案"到"证得严密":LongCat-Flash-Prover 如何让 AI 真正学会数学证明

来源: tech.meituan.com 18
让大模型做一道高中代数题,它大概率能算出正确答案。但把同样的问题换成"请证明这个结论对所有自然数成立",事情就完全不同了——答案对了不够,每一步推理都必须经得起形式化逻辑的逐行审查,一个模糊的"显然"就能让整条证明链断裂。LongCat-Flash-Prover 正是为这个更难的问题而开源的模型:它不满足于"猜答案",而是要把 AI 推向严谨的形式化定...

LongCat-AudioDiT:扔掉梅尔谱,直接在波形潜空间做扩散 TTS

来源: tech.meituan.com 35
零样本语音克隆一直有个绕不开的痛点——级联误差。从文本到梅尔谱,梅尔谱到声码器波形,每一步转换都在丢信息、叠噪声。美团 LongCat 团队刚发布的 LongCat-AudioDiT,选择了一条更激进的路:把梅尔谱这类中间表示彻底砍掉,直接在波形潜空间里跑扩散模型生成语音。这意味着整条生成链路少了一整段"翻译"环节,误差累积的根源被从中间掐断。 传统 ...

LARYBench:从人类视频学动作表征,通用视觉模型竟然碾压动作专家

来源: tech.meituan.com 36
具身智能领域有个长期隐痛:机器人需要理解"动作",但高质量的动作数据极度稀缺。于是大家把目光投向 YouTube 上海量的人类操作视频——做饭、组装、打扫,这些视频里藏着丰富的动作语义。问题是,从这些"旁观视角"的视频里学到的表征,到底能不能迁移到机器人的控制上?LARYBench 第一次给出了系统化的答案,而且结论出乎意料:通用视觉模型的动作表征,在...

AI写了90%的代码,谁来守住底线——31万行重构的约束实践

来源: tech.meituan.com 36
当仓库里超过九成代码由 AI 生成,决定系统走向的不再是"谁写得更快",而是"谁能约束 AI 的输出"。没有统一规范,AI 只会成倍放大混乱——命名不一致、架构漂移、重复抽象层层叠加,技术债不是线性增长,而是指数膨胀。 我们用 31 万行代码的重构实践验证了一个思路:把 Agent 评测的方法论搬到 AI Coding 管理上,通过技术债盘点、Rule...

Subtitle Edit 4.0.16:多格式字幕编辑的老牌工具再更新

来源: oschina.net 27
做视频的人大概都踩过字幕的坑——编码乱码、格式不兼容、时间轴偏移几秒整段对不上。Subtitle Edit 从 2001 年就开始啃这些问题,4.0.16 是这条路上的又一个维护版本。虽然更新日志看起来平淡(翻译更新、小修复),但工具本身值得重新认识,尤其是它覆盖的八种字幕格式和编码处理能力。 Subtitle Edit 支持的字幕格式覆盖了从早期 D...