AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

使用NVIDIA Cosmos 3开发物理AI推理、世界与行动模型

13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 71 NVIDIA Cosmos 3是一款面向物理AI的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。 具身智能 推理 模型发布 关联讨论 6 条 NVIDIA Blog:Generative AI(网页) X:NVIDIA AI (@NVIDIAAI) NVIDIA Blog:Agentic AI(网页) Hugging Face:Blog(RSS) IT之家(RSS) X:Kim (@kimmonismus) 推荐理由: Cosmos 3 的发布意味着物理 AI 模型从单点能力走向整合,NVIDIA 显然想在机器人时代提供基础设施,虽然刚发布还摸不着,但方向已足够清晰。

具身智能 推理 模型发布
AI HOT ·

NVIDIA Vera CPU 为AI工厂的智能体工作负载设立新标准

13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 55 NVIDIA Vera CPU 旨在为AI工厂中智能体工作负载树立新性能标杆。文章阐述了AI领域扩展规律的演变:预训练通过更大数据集、更多参数和大规模并行GPU系统扩展智能;后训练通过指令微调扩展实用性,并重新调整GPU用于生成式推理;测试时缩放则通过给模型更多生成token来提升推理能力。当前,智能体AI与强化学习正推动下一阶段的扩展。 智能体 产品更新 部署/工程 关联讨论 1 条 NVIDIA Blog:Agentic AI(网页) 推荐理由: Vera CPU 是 NVIDIA 为 Agent 时代定制的算力底座,把高吞吐和能效揉在一起,做 AI infra 的值得细看它的互联设计。

智能体 产品更新 部署/工程
AI HOT ·

介绍Cosmos Coalition

13:24 Runway:News(网页) 精选 64 Runway宣布作为创始成员加入Cosmos Coalition,该联盟与NVIDIA及多家领先AI实验室合作,旨在构建并开源面向物理AI的前沿世界模型。首个项目将由Runway与NVIDIA共同开发一个基础模型,以推动下一代开放世界模型的研究与发展。 开源生态 行业动态 关联讨论 1 条 X:Runway (@runwayml) 推荐理由: Runway 和 NVIDIA 牵头组建 Cosmos Coalition,直接瞄准开源世界模型。这个方向如果真跑通,物理 AI 的进度会被大幅拉快,但关键是开源承诺和后续生态能不能跟上。

开源生态 行业动态
AI HOT ·

NVIDIA 发布 RTX Spark 及本地 AI 智能体安全与性能更新

13:47 NVIDIA Blog:Agentic AI(网页) 精选 69 NVIDIA 发布了 RTX Spark,一款专为本地 AI 智能体设计的 Windows 电脑,提供 1 petaflops AI 算力与 128GB 统一内存。其推出的 OpenShell 运行时与微软合作,基于新的 Windows 安全原语,确保智能体在设备端安全私密运行。性能方面,通过在 llama.cpp 中采用多 token 预测等优化,Qwen 3.6 和 3.5 27B 模型推理吞吐量提升最高达 2 倍,35B 模型提升 1.6 倍;多 GPU 优化使 llama.cpp 和 ComfyUI 获得最高 2 倍性能提升。此外,Adobe、Blender 等应用也进行了更新。 智能体 Microsoft 产品更新 端侧 关联讨论 5 条 Bloomberg:Technology(RSS) X:NVIDIA (@nvidia) NVIDIA Blog:Generative AI(网页) X:NVIDIA RTX Spark (@NVIDIARTXSpark) X:卡兹克 (@Khazix0918) 推荐理由: NVIDIA 直接把 PC 从工具变成能跑本地 Agent 的「队友」,和微软从系统层联手锁死安全,llama.cpp 推理吞吐翻倍,今年秋天本地 Agent 生态真要烧起来了。

智能体 Microsoft 产品更新 端侧
AI HOT ·

腾讯混元发布智能体长期记忆插件Hy-Memory

17:07 Tencent Hy @ TencentHunyuan 精选 73 腾讯混元正式发布专为OpenClaw等长期协作智能体(Agent)设计的记忆插件 Hy-Memory。它基于6层记忆框架、System1/System2双系统与三层进化链构建,旨在成为智能体的“第二大脑”。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少70%以上,单条记忆信息密度提升45%以上,在超长上下文场景中token消耗降低35%,记忆更新速度提升20%。 智能体 MCP/工具 产品更新 推荐理由: 腾讯混元给Agent做了个记忆插件,声称能减少70%冗余记忆并提升密度,还直接支持OpenClaw,对正在踩坑Agent长期记忆的团队是个现成的实验品。

智能体 MCP/工具 产品更新
AI HOT ·

NVIDIA DSX OS 提供开放、模块化软件用于规模化运营AI工厂

12:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 70 NVIDIA DSX 平台为设计、模拟和构建 AI 工厂提供完整解决方案,旨在应对不断增长的智能需求。该平台通过开放、模块化的软件栈,帮助运营方更快地扩展规模、提高效率,并降低从能源、芯片、基础设施、模型到应用这五层架构的整体智能成本。 产品更新 部署/工程 关联讨论 1 条 NVIDIA Blog:Agentic AI(网页) 推荐理由: DSX OS 把 AI 工厂的运维标准化了,做大规模推理和训练基础设施的团队可以认真评估一下,这可能成为基础设施层的 Android。

产品更新 部署/工程
AI HOT ·

Nemotron 3 Ultra 本周即将发布。 ⌛️

12:55 NVIDIA AI @ NVIDIAAI 精选 63 开源/仓库 模型发布 关联讨论 2 条 X:Artificial Analysis (@ArtificialAnlys) IT之家(RSS) 推荐理由: 虽然只是预告,但 NVIDIA 的上一个 Nemotron 开源模型已经在社区攒下口碑,这次 Ultra 版如果真能对标闭源旗舰,这周最值得蹲的新闻就是它。

开源/仓库 模型发布
AI HOT ·

如何使用 NVIDIA Alpamayo 在闭环中后训练自动驾驶模型

13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 60 开发自动驾驶策略需要弥合训练与部署之间的鸿沟。现有的视觉-语言-动作模型虽然能推理更复杂的驾驶场景并产生更丰富的中间推理,但主要在开放循环中训练,即模型输出与真实行为直接比较,而不考虑其对环境产生的实际影响。NVIDIA Alpamayo 提供了一种在闭环环境中进行后训练的方法。 具身智能 教程/实践 部署/工程 推荐理由: NVIDIA这篇教程把自动驾驶VLA模型的后训练从开环变成了闭环,做自动驾驶的工程师可以直接照着跑,其他人可以跳过。

具身智能 教程/实践 部署/工程
AI HOT ·

教皇似乎比Geoffrey Hinton更懂人工智能

01:14 Gary Marcus:The Road to AI We Can Trust(RSS) 精选 58 这一观点强调,单纯分析AI的输出内容,无法还原其生成过程与背后的推理逻辑,触及了当前AI可解释性研究的核心挑战。 大佬观点 安全/对齐 现象/趋势 推荐理由: Gary Marcus从教皇演讲抓到一个关键差距,话语和真实推理过程是两码事,做可信AI的人值得琢磨一下。

大佬观点 安全/对齐 现象/趋势
AI HOT ·

NVIDIA与Google Cloud助力下一波AI构建者

01:44 NVIDIA Blog:Generative AI(网页) 精选 68 在Google I/O大会上,NVIDIA与Google Cloud宣布深化合作,旨在支持其联合开发者社区中超过10万名开发者。合作将重点提供NVIDIA L4 Tensor Core GPU以优化AI推理与图形工作负载,并通过支持Vertex AI平台来增强Gemini模型性能。双方还将提供开源软件工具,以简化AI应用的构建与部署流程。 Google 行业动态 部署/工程 推荐理由: 这是Google I/O上官宣的生态合作,10万开发者社区不是小数目,想在Google Cloud上用NVIDIA GPU做推理的可以关注一下配套工具链的后续。

Google 行业动态 部署/工程
AI HOT ·

全球首次:MWC26 上海将举办"人形机器人点球大战",宇树科技等 8 支队伍参赛、参演

09:28 IT之家(RSS) 精选 72 全球首次“人形机器人点球大战”将于2026年6月在MWC上海举行。8支中国顶尖具身智能战队将进行自主对抗,无需人工操控或预设脚本。赛事旨在集中展示人形机器人在动态平衡、精准控制与自主决策等方面的技术突破。 具身智能 行业动态 推荐理由: 全球首次人形机器人点球大赛,不再是论文指标或仿真跑分,而是把动态平衡、自主决策塞进一场体育规则,具身智能的进展此刻比任何展台都诚实。

具身智能 行业动态
AI HOT ·

上海:支持多模态智能体开发与应用,有序推进智能驾驶在共享出行、物流运输等多场景应用

10:28 IT之家(RSS) 精选 71 上海市人民政府办公厅印发《上海市服务业发展“十五五”规划》,提出发展AI软件技术及服务产业集群。规划支持多模态智能体开发与应用,推动智能客服等工具规模化;有序推进智能驾驶在共享出行、物流运输等多场景应用;做强算运存协同布局的智算云网络,推广模型即服务(MaaS);并支持开发面向家庭、养老、文旅等场景的具身智能整机产品,加速机器人向通用智能与精细化服务跃升。 智能体 多模态 政策/监管 推荐理由: 这份上海“十五五”规划相当于一份AI落地指南,多模态智能体、无人驾驶物流、具身智能都点到了,虽非重磅突破,但给在沪AI公司画出了清晰的增长路线。

智能体 多模态 政策/监管
AI HOT ·

MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型

11:39 MiniMax:Blog(网页) 精选 83 MiniMax M3 是一个开源前沿模型,具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口,并采用名为MSA(MiniMax Sparse Attention)的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20,预填充速度提升9倍以上,解码速度提升15倍以上。在SWE-Bench Pro编码基准上,MiniMax M3得分59.0%,超越GPT-5.5和Gemini 3.1 Pro,性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。 多模态 开源/仓库 推理 模型发布 关联讨论 8 条 X:MiniMax (@MiniMax_AI) X:OpenRouter (@OpenRouter) IT之家(RSS) X:opencode (@opencode) X:Testing Catalog (@testingcatalog) X:歸藏 (@op7418) X:karminski (@karminski3) X:硅基流动 SiliconFlow (@SiliconFlowAI) 推荐理由: MiniMax M3 把开源模型的编码能力推到了 GPT-5.5 和 Opus 4.7 这条线上,还附带 1M 上下文和原生多模态,这是开源社区真正能打的前沿选项,做 Agent 的值得立刻跑一下。

多模态 开源/仓库 推理 模型发布
AI HOT ·

我们希望帮助世界在生物防御领域抢占先机:

23:13 Sam Altman @ sama 精选 75 OpenAI 安全/对齐 推荐理由: OpenAI 跨入生物防御,用 AI 提前预警和应对疫情威胁,这不只是技术问题,更关乎社会韧性,值得每个关注 AI 安全的人认真读一下。 20:18 Chubby♨️ @ kimmonismus 精选 75 苹果WWDC将推AI升级:Gemini蒸馏模型本地运行,但技术栈外部依赖显著 苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级,核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型,以强调隐私与降低token成本。但该技术栈大部分源自外部:本地模型由Gemini蒸馏,设备无法处理的复杂查询将路由至Google Cloud处理,并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。此外,苹果2024年承诺的Private Cloud Compute方案原计划使用苹果芯片,因无法承载完整Gemini模型,现已部分转向谷歌云,但该名称仍将保留。 Google 端侧 行业动态 推荐理由: 苹果Siri的救命稻草原来是Gemini,更扎心的是那些‘离开iPhone的查询’现在跑在Google Cloud上,Private Cloud Compute只剩个名字,做端侧推理和隐私计算的同行该注意风向变了。 10:24 IT之家(RSS) 精选 72 6000 多公里全程零干预:特斯拉 FSD 完成全球首次横穿加拿大自动驾驶 一辆特斯拉汽车搭载 FSD V14.3.3 版本软件,完成了全球首次全程零人工干预、横穿加拿大的自动驾驶行程。车辆从温哥华出发,历时 4 天 21 小时,行驶 3760 英里(6051 公里)抵达哈利法克斯,全程所有驾驶操作(包括高速并线、应对复杂路况与自动泊车)均由系统自主完成,无任何系统退出或人工修正。该版本随 2026.14.6.6 更新推送,整合了春季软件功能。 端侧 行业动态 推荐理由: 车主自己跑的6千公里零干预记录,比任何官方demo都实在。零接管、过施工、全自动泊车,FSD这个能力信号,对自动驾驶行业是颗定心丸。 05:43 Simon Willison 博客 精选 73 在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用 作者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用。此前的 Datasette Lite 使用 Web Workers,但无法执行 `<script>` 标签中的 JavaScript。新方案由 Claude Opus 4.8 协助完成开发,解决了这一问题。作者已展示了基础的 ASGI FastCGI 演示和运行 Datase

OpenAI 安全/对齐 Google 端侧 行业动态 GitHub 教程/实践 部署/工程 大佬观点 产品更新 推理 Microsoft 编码 数据/训练 现象/趋势
AI HOT ·

OpenAI正式进军机器人领域并启动招聘

00:13 Sam Altman @ sama 精选 83 OpenAI宣布成立OpenAI Robotics团队,并开始招聘全栈硬件、系统及ML工程师,以编程和制造能服务社会的机器人。该项目由Aditya Ramesh领导,其世界模拟研究计划已演变为机器人研究,强调硬件与ML研究的协同设计。短期目标是支持技术工人构建未来基础设施,长期愿景是为每个人提供个人机器人。 OpenAI 具身智能 行业动态 关联讨论 2 条 X:Emad Mostaque (@EMostaque) IT之家(RSS) 推荐理由: OpenAI 正式踩进物理世界,从软件杀到硬件,这步迟早要来。短期说辅助工人,长期说人人都一个机器人,野心和风险一样大。

OpenAI 具身智能 行业动态
AI HOT ·

我花200英镑把一台数据中心级GPU装进了我的游戏电脑

00:15 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 一名用户以200英镑的价格购入了一块数据中心级GPU,并将其成功安装到自己的游戏电脑中。文章记述了这一非标准硬件改装过程、遇到的技术挑战以及最终实现本地运行大语言模型的体验。 教程/实践 端侧 部署/工程 推荐理由: 用200英镑把一块V100塞进游戏机箱跑Llama,这个折腾过程比benchmark更有看头,想低成本玩本地模型的可以抄作业。

教程/实践 端侧 部署/工程
AI HOT ·

6000 多公里全程零干预:特斯拉 FSD 完成全球首次横穿加拿大自动驾驶

10:24 IT之家(RSS) 精选 72 一辆特斯拉汽车搭载 FSD V14.3.3 版本软件,完成了全球首次全程零人工干预、横穿加拿大的自动驾驶行程。车辆从温哥华出发,历时 4 天 21 小时,行驶 3760 英里(6051 公里)抵达哈利法克斯,全程所有驾驶操作(包括高速并线、应对复杂路况与自动泊车)均由系统自主完成,无任何系统退出或人工修正。该版本随 2026.14.6.6 更新推送,整合了春季软件功能。 端侧 行业动态 推荐理由: 车主自己跑的6千公里零干预记录,比任何官方demo都实在。零接管、过施工、全自动泊车,FSD这个能力信号,对自动驾驶行业是颗定心丸。

端侧 行业动态
AI HOT ·

苹果WWDC将推AI升级:Gemini蒸馏模型本地运行,但技术栈外部依赖显著

20:18 Chubby♨️ @ kimmonismus 精选 75 苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级,核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型,以强调隐私与降低token成本。但该技术栈大部分源自外部:本地模型由Gemini蒸馏,设备无法处理的复杂查询将路由至Google Cloud处理,并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。此外,苹果2024年承诺的Private Cloud Compute方案原计划使用苹果芯片,因无法承载完整Gemini模型,现已部分转向谷歌云,但该名称仍将保留。 Google 端侧 行业动态 推荐理由: 苹果Siri的救命稻草原来是Gemini,更扎心的是那些‘离开iPhone的查询’现在跑在Google Cloud上,Private Cloud Compute只剩个名字,做端侧推理和隐私计算的同行该注意风向变了。

Google 端侧 行业动态
AI HOT ·

在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用

05:43 Simon Willison 博客 精选 73 作者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用。此前的 Datasette Lite 使用 Web Workers,但无法执行 `<script>` 标签中的 JavaScript。新方案由 Claude Opus 4.8 协助完成开发,解决了这一问题。作者已展示了基础的 ASGI FastCGI 演示和运行 Datasette 1.0a31 的演示,并计划后续将此方法应用于升级 Datasette Lite。 GitHub 教程/实践 端侧 部署/工程 推荐理由: Simon Willison 用 Service Worker 让 Python ASGI 在浏览器里真正跑了起来,这个技巧补上了 Datasette Lite 长期缺的 JS 执行能力,搞 Pyodide 的值得看看。

GitHub 教程/实践 端侧 部署/工程