我花200英镑把一台数据中心级GPU装进了我的游戏电脑
00:15 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 一名用户以200英镑的价格购入了一块数据中心级GPU,并将其成功安装到自己的游戏电脑中。文章记述了这一非标准硬件改装过程、遇到的技术挑战以及最终实现本地运行大语言模型的体验。 教程/实践 端侧 部署/工程 推荐理由: 用200英镑把一块V100塞进游戏机箱跑Llama,这个折腾过程比benchmark更有看头,想低成本玩本地模型的可以抄作业。
AI and technology watch
聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。
00:15 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 一名用户以200英镑的价格购入了一块数据中心级GPU,并将其成功安装到自己的游戏电脑中。文章记述了这一非标准硬件改装过程、遇到的技术挑战以及最终实现本地运行大语言模型的体验。 教程/实践 端侧 部署/工程 推荐理由: 用200英镑把一块V100塞进游戏机箱跑Llama,这个折腾过程比benchmark更有看头,想低成本玩本地模型的可以抄作业。
10:24 IT之家(RSS) 精选 72 一辆特斯拉汽车搭载 FSD V14.3.3 版本软件,完成了全球首次全程零人工干预、横穿加拿大的自动驾驶行程。车辆从温哥华出发,历时 4 天 21 小时,行驶 3760 英里(6051 公里)抵达哈利法克斯,全程所有驾驶操作(包括高速并线、应对复杂路况与自动泊车)均由系统自主完成,无任何系统退出或人工修正。该版本随 2026.14.6.6 更新推送,整合了春季软件功能。 端侧 行业动态 推荐理由: 车主自己跑的6千公里零干预记录,比任何官方demo都实在。零接管、过施工、全自动泊车,FSD这个能力信号,对自动驾驶行业是颗定心丸。
20:18 Chubby♨️ @ kimmonismus 精选 75 苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级,核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型,以强调隐私与降低token成本。但该技术栈大部分源自外部:本地模型由Gemini蒸馏,设备无法处理的复杂查询将路由至Google Cloud处理,并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。此外,苹果2024年承诺的Private Cloud Compute方案原计划使用苹果芯片,因无法承载完整Gemini模型,现已部分转向谷歌云,但该名称仍将保留。 Google 端侧 行业动态 推荐理由: 苹果Siri的救命稻草原来是Gemini,更扎心的是那些‘离开iPhone的查询’现在跑在Google Cloud上,Private Cloud Compute只剩个名字,做端侧推理和隐私计算的同行该注意风向变了。
05:43 Simon Willison 博客 精选 73 作者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用。此前的 Datasette Lite 使用 Web Workers,但无法执行 `<script>` 标签中的 JavaScript。新方案由 Claude Opus 4.8 协助完成开发,解决了这一问题。作者已展示了基础的 ASGI FastCGI 演示和运行 Datasette 1.0a31 的演示,并计划后续将此方法应用于升级 Datasette Lite。 GitHub 教程/实践 端侧 部署/工程 推荐理由: Simon Willison 用 Service Worker 让 Python ASGI 在浏览器里真正跑了起来,这个技巧补上了 Datasette Lite 长期缺的 JS 执行能力,搞 Pyodide 的值得看看。
03:22 Bloomberg:Technology(RSS) 精选 71 软银集团计划投资高达750亿欧元(约合870亿美元),用于在法国建设人工智能数据中心。该投资计划由《论坛报》与《金融时报》报道。 行业动态 部署/工程 关联讨论 2 条 X:Rohan Paul (@rohanpaul_ai) IT之家(RSS) 推荐理由: 750亿欧元的投资规模,让法国一夜之间成为欧洲AI基建的核心,对算力格局影响深远,做AI基础设施的人该盯紧了。
02:34 AYi @ AYi_AInotes 精选 75 NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。 NVIDIA : A new era of PC. 25.0528, 121.5990 大佬观点 端侧 推荐理由: 三家巨头同发三个词和一个坐标,这比芯片参数更值得嗅的信号是,NVIDIA要从装空调的变成盖房子的,Windows 阵营的 Intel inside 可能真要换标了。
13:26 NVIDIA @ nvidia 精选 65 智能体 产品更新 端侧 关联讨论 1 条 Bloomberg:Technology(RSS) 推荐理由: 1-petaflop 芯片装进个人电脑,把 CUDA 生态带到了笔记本级别,Windows 原生 agent 第一次有了专门的硬件底座,端侧 AI 的行业规则可能要重写。 13:24 Runway:News(网页) 精选 64 介绍Cosmos Coalition Runway宣布作为创始成员加入Cosmos Coalition,该联盟与NVIDIA及多家领先AI实验室合作,旨在构建并开源面向物理AI的前沿世界模型。首个项目将由Runway与NVIDIA共同开发一个基础模型,以推动下一代开放世界模型的研究与发展。 开源生态 行业动态 推荐理由: Runway 和 NVIDIA 牵头组建 Cosmos Coalition,直接瞄准开源世界模型。这个方向如果真跑通,物理 AI 的进度会被大幅拉快,但关键是开源承诺和后续生态能不能跟上。 13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 55 NVIDIA Vera CPU 为AI工厂的智能体工作负载设立新标准 NVIDIA Vera CPU 旨在为AI工厂中智能体工作负载树立新性能标杆。文章阐述了AI领域扩展规律的演变:预训练通过更大数据集、更多参数和大规模并行GPU系统扩展智能;后训练通过指令微调扩展实用性,并重新调整GPU用于生成式推理;测试时缩放则通过给模型更多生成token来提升推理能力。当前,智能体AI与强化学习正推动下一阶段的扩展。 智能体 产品更新 部署/工程 推荐理由: Vera CPU 是 NVIDIA 为 Agent 时代定制的算力底座,把高吞吐和能效揉在一起,做 AI infra 的值得细看它的互联设计。 13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 71 使用NVIDIA Cosmos 3开发物理AI推理、世界与行动模型 NVIDIA Cosmos 3是一款面向物理AI的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。 具身智能 推理 模型发布 关联讨论 1 条 X:NVIDIA AI (@NVIDIAAI) 推荐理由: Cosmos 3 的发布意味着物理 AI 模型从单点能力走向整合,NVIDIA 显然想在机器人时代提供基础设施,虽然刚发布还摸不着,但方向已足够清晰。 13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 60 如何使用 NVIDIA Alpamayo 在闭环中后训练自动驾驶模型
19:59 Bloomberg:Technology(RSS) 精选 73 在新加坡举行的防务论坛上,专家警告AI风险已超越核武器。面板讨论指出,AI可能大幅压缩反应时间,导致决策者做出草率决定,对战略稳定构成威胁。 安全/对齐 政策/监管 推荐理由: 国防圈第一次把AI危险摆到比核武更高的位置,这种定性一旦被政策圈采纳,全球监管的天平会剧烈倾斜。
21:16 The Verge:AI(RSS) 精选 73 有卖家利用 AI 生成虚假的黑人形象,在 TikTok、Facebook 和 Instagram 上扮演手工制品创作者进行销售。例如一个名为 Aliyah 的 AI 生成形象,以带泪诉说的方式售卖所谓手工皮带扣,但该形象及其产品均为虚构。此类 AI 虚拟网红被用于推广通过代发货模式销售的批量生产品。 图像生成 多模态 现象/趋势 推荐理由: AI生成的虚拟黑人卖家在TikTok上哭着卖假货,The Verge这篇调查把AI黑产里最脏的那面扒给你看,做社交电商的尤其该点开读。
23:34 AYi @ AYi_AInotes 精选 75 OpenAI为开源项目维护者提供福利,可免费领取6个月ChatGPT Pro(价值$1200),申请无硬性Star数要求,有项目链接即可。同时,文章引用讨论了AI工具的分类:一类是“agent型”(如Claude Code、Codex),可自主运行;另一类是“实习生型”(如Cursor),需人工决策,有助于使用者以术入道、培养判断力,但受限于需人在场。作者推荐了网易的UU远程工具,称其免费两年,支持4K 144帧无延迟连接Mac并可使用原生终端,解决了“实习生型”工具的地点限制问题。 AYi : 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思... OpenAI 其他 开源生态 推荐理由: OpenAI 给开源维护者送 6 个月 Pro,没 Star 要求,有项目链接就行,我觉得这是今年最实在的开发者福利,手慢无。 21:16 The Verge:AI(RSS) 精选 73 AI 骗子正在创建虚假的黑人形象来销售 Shein 劣质商品 有卖家利用 AI 生成虚假的黑人形象,在 TikTok、Facebook 和 Instagram 上扮演手工制品创作者进行销售。例如一个名为 Aliyah 的 AI 生成形象,以带泪诉说的方式售卖所谓手工皮带扣,但该形象及其产品均为虚构。此类 AI 虚拟网红被用于推广通过代发货模式销售的批量生产品。 图像生成 多模态 现象/趋势 推荐理由: AI生成的虚拟黑人卖家在TikTok上哭着卖假货,The Verge这篇调查把AI黑产里最脏的那面扒给你看,做社交电商的尤其该点开读。 19:59 Bloomberg:Technology(RSS) 精选 73 新加坡防务论坛:AI 风险超过核武器 在新加坡举行的防务论坛上,专家警告AI风险已超越核武器。面板讨论指出,AI可能大幅压缩反应时间,导致决策者做出草率决定,对战略稳定构成威胁。 安全/对齐 政策/监管 推荐理由: 国防圈第一次把AI危险摆到比核武更高的位置,这种定性一旦被政策圈采纳,全球监管的天平会剧烈倾斜。 19:45 Google AI Developers @ googleaidevs 精选 71 ICYMI:Nano Banana Pro 【gemini-3-pro-image】 和 Nano Banana 2 【gemini-3.1-flash-image】 现已正式发布,可通过 Gemini API 投入生产使用。 查看这些优秀的社区示例,了解两个模型的实际能力 🧵 Google 图像生成 模型发布 推荐理由: Ge
00:12 Hacker News 热门(buzzing.cc 中文翻译) 精选 71 由于运行和使用AI工具的成本持续飙升,美国企业正开始对人工智能的使用实施配给制。企业通过限制使用量、设置分层级审批流程等方式控制开支,以应对AI费用增长过快的问题。这种从广泛采用转向精细化管理的策略,标志着企业在AI应用上从追求速度转向注重成本效益。 数据/训练 现象/趋势 部署/工程 推荐理由: 成本飙升让大企业开始对AI‘配给’,这是面向企业的AI产品必须回答的ROI考题,以前铺量抢客户的玩法得切换成算清每一分钱的价值。
00:46 TechCrunch:AI(RSS) 精选 70 微软旗下 GitHub Copilot 的黄金时代似乎正在终结。其新推出的计费模式改为按 token 计量,这一变化引发了开发者的广泛担忧与不满。 GitHub Microsoft 编码 行业动态 推荐理由: Copilot 从固定订阅变成 token 计费,对重度用户来说就是变相涨价,做 coding 的该算算账了,微软这招挺损的。
01:52 NVIDIA AI @ NVIDIAAI 精选 63 NVIDIA 发布 DynoSim,这是一个针对其 Dynamo 推理服务栈的工作负载驱动仿真工具。它将部署测试转化为“模拟-验证”循环:团队无需逐个测试部署选项,而是在单一虚拟时间线上建模整个堆栈,通过高保真仿真快速筛查数千种配置,仅将最佳候选方案投入实机验证。DynoSim 完全使用 Rust 实现,运行速度极快,在测试中达到实时速度的 1,500 倍。 产品更新 推理 部署/工程 推荐理由: DynoSim 把推理部署的配置搜索从暴力枚举变成 1500 倍加速的模拟验证,做推理优化的人应该马上看一眼。
19:45 Google AI Developers @ googleaidevs 精选 71 Google 图像生成 模型发布 推荐理由: Gemini 图像模型 GA 了,生成式视觉正式进入 Google 时间,做设计工具和内容生成的开发者可以直接接入测试,看看能不能成为下一个 Midjourney。
02:59 OpenCode @ opencode 精选 63 DeepSeek 产品更新 编码 推荐理由: DeepSeek V4 Flash 火速上岸 OpenCode Zen,想尝鲜的开发者现在就能在编辑器里直接调用,动作快得有点不像开源生态的节奏。
08:07 OpenCode @ opencode 精选 63 推理 模型发布 关联讨论 2 条 IT之家(RSS) X:MiniMax (@MiniMax_AI) 推荐理由: MiniMax的M3在OpenCode偷偷上了免费试用,虽然没正式发布,但做中文生成的同学现在就能上手摸,是骡子是马先遛一圈。
19:11 StepFun @ StepFun_ai 精选 62 Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 - ∞) : I've been waiting for this! They managed to do it before June, and they open sourced it right away! @antirez I've been s... 多模态 开源/仓库 模型发布 端侧 推荐理由: StepFun 赶在六月前发了一款小参数开源多模态模型,比 V4-Flash 还小还快,直接开源,做端侧和快速集成的值得立刻拉下来试试。
15:41 Hacker News 热门(buzzing.cc 中文翻译) 精选 71 Steve Yegge 在 Medium 发表观点文章《最后一次技术面试》,探讨 AI 时代传统技术面试的意义变化。文章在 Hacker News 社区获得 100 分关注。 大佬观点 编码 推荐理由: Steve Yegge 用他一贯犀利的文笔预言技术面试的终结,这不是危言耸听,而是给所有还在刷 LeetCode 的开发者提前拉响的警报。
12:18 SemiAnalysis @ SemiAnalysis_ 精选 76 xAI 开源生态 行业动态 推荐理由: xAI 这个 GPU 最大客户突然甩了 JAX,要自研 C 训练框架,理由是 JAX 利用率太低。如果连万亿参数集群都搞不定,JAX 的底层缺陷可能比想象的大,做大规模训练的团队得认真评估了。
08:06 OpenRouter @ OpenRouter 精选 72 ComfyUI : ComfyUI just added @OpenRouter support. Instead of being locked into a single LLM, you can now access 20+ models directl... 产品更新 多模态 开源生态 推荐理由: ComfyUI 首次直接集成 LLM 路由服务,等于给图像管线加了个「外挂大脑」,做自动化工作流的人可以直接在节点里调用 20+ 模型,省掉一堆 API tinker 环节。
有任何建议或问题,欢迎告诉我们
感谢您的反馈!