AI 精选工程笔记

技术摘要

AI 精选与摘要技术文章、编程实践和人工智能新闻。

---

PlanningBench:让大模型"真会规划"有了一把可验证的尺子

来源: oschina.net 33
大语言模型写诗、写代码、写摘要的能力已经被各类基准反复检验,但"规划"这项更接近真实决策的核心能力,一直缺乏系统化、可扩展的评测手段。腾讯混元团队联合中国人民大学高瓴人工智能学院等机构开源的 PlanningBench,正是要补上这块短板——它从真实规划场景出发,抽象任务结构与约束,构建覆盖 30+ 任务类型的数据生成与验证体系,让"模型到底能不能规划...

WSL 2 跨系统文件访问的性能困局与破局

来源: oschina.net 22
2016 年,WSL 1 用一套精巧的 DrvFs 方案让 Linux 进程几乎"零距离"触碰 NTFS—— 下的读写延迟极低,体验接近原生。2019 年 WSL 2 换上完整 Linux 内核跑在 Hyper-V 虚拟机里,Linux 生态兼容性飞跃,但代价是:从 VM 内访问 Windows 分区,数据要穿越 VirtIO 设备链路、9P 协议栈、...

WWDC 2026:苹果要把 AI 从"功能"做成"系统"

来源: oschina.net 27
过去一年,AI 行业的叙事几乎被模型竞赛主导——推理能力、上下文长度、Agent 完整度、自动化工作流深度,每一项都在刷榜。但下周的 WWDC,风向可能不一样。人们不再只问"模型强了多少",而是问:苹果怎么把 AI 嵌回具体的产品体验? 这恰恰是苹果最擅长的事。它不比参数量,它比"你用不用得上"。 "AI 功能"和"AI 系统"的区别,简单说就是—— ...

从 Vite 到 VoidZero:独立开源项目如何走向被收购

来源: my.oschina.net 34
创业不到两年,尤雨溪把 VoidZero 卖了。买家是硅谷巨头,收购后 Vite 继续开源,团队继续主导开发。这件事在国内开源圈找不到第二个参照——我们更熟悉的剧本是:做免费工具、接外包养项目、维持不下去就放弃。 VoidZero 的完整路径提供了一个值得拆解的样本:开源项目 → 商业公司 → 被收购 → 项目与团队双双保留。这中间每一步的选择,比最终...

Windows 浏览器默认设置:微软到底卡了哪些脖子?

来源: oschina.net 36
浏览器选择联盟(Browser Choice Alliance)最近给微软写了一封公开信,标题只有四个字:《微软,够了》。信中列举了微软在 Windows 中压制竞争对手浏览器的种种手段——从系统级弹窗拦截、Edge 强制捆绑,到经济层面的 OEM 合约限制。这不是抽象的垄断指控,而是每一个 Windows 用户每天都在经历的"微操":你明明装了 Ch...

一部纪录片,四十年 C++:从贝尔实验室的"带类的 C"到全球增长最快的主流语言

来源: oschina.net 22
2026年6月4日,C++标准委员会前主席、现Citadel Securities技术Fellow Herb Sutter在个人博客宣布:《C++: The Documentary》正式在YouTube上线首播。近70分钟的影片,把C++从1983年AT&T贝尔实验室里那个叫"C with Classes"的实验项目,一路讲到今天成为全球四大主...

PHP 8.5.7:几个值得留意的漏洞修复

来源: oschina.net 26
PHP 8.5 系列的第七个补丁版本发布了。版本号看着不起眼,但里面修了几个能直接踩到的坑—— 行为异常、日期计算溢出、DOM XPath 自定义函数的内存安全问题,以及 Opcache 在特定调用场景下的 VM 处理缺陷。如果你已经在跑 PHP 8.5,这版值得尽快跟进。 CLI 场景下 对"可选值"参数的处理出了偏差。所谓可选值,就是参数声明为 —...

TypeORM 1.0 正式发布:近十年等待后的现代化重塑

来源: infoq.com 32
从 2016 年诞生到 2025 年终于推出 1.0,TypeORM 走了一条漫长的路。这个被无数 NestJS 项目默认绑定的 ORM,长期停留在 0.x 版本,维护节奏一度让人担忧。1.0 的到来不只是版本号的跃迁——它意味着平台要求的现代化、废弃 API 的清理、安全与迁移流程的加固,以及社区维护信心的重建。 TypeORM 早期采用"0.x 永...

Anthropic 公开宣称 AI 自我改进进入临界区间——内部代码自动化率突破 80%

来源: oschina.net 16
Anthropic 在官网发布了一篇关于"递归自我改进"的研究文章,这是他们首次系统性地向公众阐述 AI 自我编写、自我优化代码的趋势规模与速度。核心判断很直接:AI 能力的提升速度正在加快,而非趋缓。公开基准测试上的任务完成率在缩短时间窗口内持续攀升,而 Anthropic 内部数据更具冲击力——代码自动化率已经超过 80%。这意味着什么?不是"AI...

CISA 紧急警告:Android 整数溢出漏洞 CVE-2025-48595 正被主动利用

来源: oschina.net 34
美国网络安全和基础设施安全局(CISA)近日将其 Known Exploited Vulnerabilities 目录新增了一条记录——CVE-2025-48595。这不是一个"可能被利用"的纸上漏洞,而是已被实际攻击者使用的高危缺陷。该漏洞存在于 Android 框架层,本质是整数溢出,攻击者可借此提升本地权限。CISA 的 KEV 目录只收录"正在...