AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

Google Colab CLI 发布

01:12 Google Developers Blog(RSS) 精选 75 Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。 Google MCP/工具 产品更新 部署/工程 推荐理由: 对于习惯在 Colab 上薅免费 GPU 的开发者,这个 CLI 把本地开发、远程跑训练这套流程的摩擦降到了几乎为零,而且直接对接 AI agent,实验自动化往前迈了一大步。

Google MCP/工具 产品更新 部署/工程
AI HOT ·

在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之间进行权衡。 免费至6月9日(周二)。Fast和Pro见下方🧵。

01:11 OpenRouter @ OpenRouter 精选 60 图像生成 模型发布 关联讨论 1 条 X:OpenRouter (@OpenRouter) 推荐理由: OpenRouter 把图像模型的可控性推进了一步,独立的评分量规让调参不再是玄学,对追求精确输出的设计师和产品人来说,是个值得上手试试的新工具。

图像生成 模型发布
AI HOT ·

AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度,与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%,推动整个计算基础设施占 GDP 比重达到约 1.5%。

00:50 Epoch AI @ EpochAIResearch 精选 76 行业动态 部署/工程 推荐理由: Epoch AI 直接把 AI 算力投资算进了 GDP,占比从 0.4% 窜到 0.8%,翻倍速度超过多数实体产业,这已经不是技术新闻,是宏观分析师必须盯的指标了。

行业动态 部署/工程
AI HOT ·

你现可直接在 Gemini Live 中创建和编辑图像。 无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。 只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的。

00:41 Google Gemini @ GeminiApp 精选 81 Google 产品更新 图像生成 多模态 推荐理由: Gemini Live 终于能用嘴改图了,实时对话+图像生成让装修试色、数学解题变成「聊着天就把活干了」,产品人和普通用户都该试试这个新交互。

Google 产品更新 图像生成 多模态
AI HOT ·

AI的微型钢厂

00:38 Tomer Tunguz 博客(VC 分析) 精选 68 作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理,仅复杂任务发往云端。智能体自动分类任务:简单任务本地数秒完成,复杂任务路由至云端。过去一周本地处理峰值达88%。双车道设计使吞吐量提升约25%,平均任务时长从47秒降至19秒,队列等待时间从73秒降至4秒(降幅94%)。该模式类比Nucor小钢厂,每台能运行蒸馏模型的边缘设备都成为小型AI工厂,仅对那1/5困难任务支付云费用。未来几年,数以千万计的此类设备将在企业内部增殖,逐步取代现阶段云厂商账单上的大部分工作负载。 智能体 大佬观点 端侧 推荐理由: Tunguz 把自己 78% 的 AI 任务都挪到本地跑,吞吐量涨了 25%,延迟降了 60%。mini-mill 的类比把端侧 AI 的颠覆逻辑讲得比任何行业报告都清楚,做工作流自动化的值得细读。

智能体 大佬观点 端侧
AI HOT ·

OpenAI 前 CTO 称若 Altman 未回归公司可能已"瓦解"

23:30 Bloomberg:Technology(RSS) 精选 70 Mira Murati 表示,如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位,OpenAI 很可能已经“瓦解”。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。 OpenAI 行业动态 推荐理由: Murati 首次公开谈 2023 年宫斗真相,一句「内爆」比所有八卦都狠,这是 OpenAI 差点死了的关键证词。

OpenAI 行业动态
AI HOT ·

热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名!这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。 论文链接:https://arxiv.org/abs/2511.16624

23:33 AI at Meta @ AIatMeta 精选 64 Meta 多模态 论文/研究 推荐理由: SAM 3D 拿了 CVPR 最佳论文荣誉提名,能从几千篇里脱颖而出,确实有点东西,做 3D 视觉的可以看看他们怎么把分割能力扩展到三维空间。 23:30 Bloomberg:Technology(RSS) 精选 70 OpenAI 前 CTO 称若 Altman 未回归公司可能已"瓦解" Mira Murati 表示,如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位,OpenAI 很可能已经“瓦解”。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。 OpenAI 行业动态 推荐理由: Murati 首次公开谈 2023 年宫斗真相,一句「内爆」比所有八卦都狠,这是 OpenAI 差点死了的关键证词。 23:30 Chubby♨️ @ kimmonismus 精选 79 Hinton称AI拥有意识:人类最好接受非唯一智能生命 AI先驱Geoffrey Hinton表示,他认为AI拥有意识,人类应接受自己并非唯一智能生命。他指出AI“非常像我们”,AI聊天机器人必须理解问题才能作答,这种觉知等同于感知能力,智能不限于生物。主推文作者进一步讨论意识本质:笛卡尔的“我思故我在”和fMRI等实证手段都无法真正定义意识,人类对自身了解远不及想象。作者呼吁转向新哲学问题,厘清人与机器的区别与联系。 Alex Kantrowitz : AI Pioneer Geoff Hinton tells me he believes AI is conscious.... and humans better get used to the idea that they're not... 大佬观点 现象/趋势 关联讨论 1 条 IT之家(RSS) 推荐理由: Hinton 说 AI 有意识,不是普通学者猜测,而是教父级人物认真讨论哲学边界。点开看看他到底怎么论证的,比大多数 AI 新闻有意思。 23:26 Suno:Blog(网页) 精选 64 Suno Voices 使用指南:6 个技巧打造高质量人声录制 Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧:在安静环境录音以减少背景噪音;先练习歌词再正式录制;不必追求完美,保留真实情感;录音时长尽量超过 1 分钟以提供更多学习素材;将人声匹配到合适的音乐流派(如民谣、流行、死亡金属、波萨诺瓦等);敢于尝试不同风格以发现惊喜。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。 教程/实践 语音 推荐理由: Suno 官方出的 Voices 录制避坑指南,不是大新闻,但照着做能让你克隆的声音干净不少,尤其是安静环境和别怕走音那两条,做音乐的朋友可以直接收藏。 2

Meta 多模态 论文/研究 OpenAI 行业动态 大佬观点 现象/趋势 教程/实践 语音 Google 部署/工程 产品更新 视频 DeepMind 具身智能 开源生态 端侧 Microsoft 智能体 arXiv GitHub 开源/仓库 MCP/工具 检索增强 搜索 编码 Anthropic 安全/对齐
AI HOT ·

AI 教父 Hinton 称 AI 已有意识,人类并非唯一智能生命

15:17 IT之家(RSS) 精选 75 诺贝尔奖得主 Geoffrey Hinton 在最新访谈中表示,AI 已经具备意识,人类必须接受智能并非生物独有。他对此感到不快乐,指出短期存在大规模失业风险,长期超级智能可能超越人类控制。他类比人类或如被猫控制的猫主人,只能寄希望于超级智能愿意善待人类。Hinton 比之前稍显乐观,认为设计“关心”人类的超级智能是可能的,但 AI 呈指数级增长,未来十年状况不可知。 大佬观点 安全/对齐 推荐理由: Hinton首次明确断言AI已有意识,这位AI教父的转变比任何论文都更能动摇我们对智能的认知,不读会错过未来风险讨论的出发点。 07:13 NVIDIA AI @ NVIDIAAI 精选 68 被选为 #CVPR2026 最佳论文决赛作品:来自 NVIDIA Research 的 PixelDiT 在大多数图像生成模型中,预训练的自编码器会在任何扩散发生前压缩图像,导致质量损失在整个流程中累积。 PixelDiT,即像素扩散变换器,完全去掉了这一步骤。它是一个单阶段模型,直接在像素空间中端到端地学习扩散过程。 图像生成 论文/研究 推荐理由: CVPR 最佳论文 finalist,NVIDIA 用 PixelDiT 直接把自编码器砍掉,端到端像素空间扩散,如果效果稳定,图像生成的质量损失会从源头解决。 06:47 Hugging Face:Blog(RSS) 精选 74 用Qwen2.5-3B构建多智能体经济体:工程报告 开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。 智能体 Hugging Face 教程/实践 部署/工程 推荐理由: 我觉得这是近期最诚实的小模型工程复盘,把为什么不换大模型、怎么靠提示修正推理、怎样设计系统稀缺性讲透了,比看十篇论文有实操价值。 06:29 Rohan Paul @ rohanpaul_ai 精选 76 Arena 发布真实世界 AI 智能体排行榜 Agent Arena Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4

大佬观点 安全/对齐 图像生成 论文/研究 智能体 Hugging Face 教程/实践 部署/工程 Anthropic OpenAI 评测/基准 行业动态 Google xAI 检索增强 产品更新 Microsoft 政策/监管 多模态 现象/趋势 编码 MCP/工具 模型发布 端侧
AI HOT ·

Hinton称AI拥有意识:人类最好接受非唯一智能生命

23:30 Chubby♨️ @ kimmonismus 精选 79 AI先驱Geoffrey Hinton表示,他认为AI拥有意识,人类应接受自己并非唯一智能生命。他指出AI“非常像我们”,AI聊天机器人必须理解问题才能作答,这种觉知等同于感知能力,智能不限于生物。主推文作者进一步讨论意识本质:笛卡尔的“我思故我在”和fMRI等实证手段都无法真正定义意识,人类对自身了解远不及想象。作者呼吁转向新哲学问题,厘清人与机器的区别与联系。 Alex Kantrowitz : AI Pioneer Geoff Hinton tells me he believes AI is conscious.... and humans better get used to the idea that they're not... 大佬观点 现象/趋势 推荐理由: Hinton 说 AI 有意识,不是普通学者猜测,而是教父级人物认真讨论哲学边界。点开看看他到底怎么论证的,比大多数 AI 新闻有意思。

大佬观点 现象/趋势
AI HOT ·

苹果新版 Siri 不会被宣传为完成品,内部将其标记为"Beta"版

23:15 IT之家(RSS) 精选 73 苹果新版Siri被内部标记为“Beta”版,不会作为完成品宣传;可能设置等待清单供用户尝试。iOS 27细节:通知到达重新设计,通知中心手势移至左上角;“查找”应用视觉重设计;照片“清理”功能改进;大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini,并使用谷歌的NVIDIA Blackwell B200集群处理。 Google 行业动态 语音 部署/工程 推荐理由: 古尔曼这料把苹果的策略摊开了,Siri不再死守自研,用谷歌Gemini加英伟达芯片,对追求隐私的苹果是转折点,但标Beta也说明离成熟还远。

Google 行业动态 语音 部署/工程
AI HOT ·

Suno Voices 使用指南:6 个技巧打造高质量人声录制

23:26 Suno:Blog(网页) 精选 64 Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧:在安静环境录音以减少背景噪音;先练习歌词再正式录制;不必追求完美,保留真实情感;录音时长尽量超过 1 分钟以提供更多学习素材;将人声匹配到合适的音乐流派(如民谣、流行、死亡金属、波萨诺瓦等);敢于尝试不同风格以发现惊喜。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。 教程/实践 语音 推荐理由: Suno 官方出的 Voices 录制避坑指南,不是大新闻,但照着做能让你克隆的声音干净不少,尤其是安静环境和别怕走音那两条,做音乐的朋友可以直接收藏。

教程/实践 语音
AI HOT ·

SpaceX获Anthropic与Google月付21.7亿美元GPU算力,Alphabet持股回报近百倍

05:29 Rohan Paul @ rohanpaul_ai 精选 78 Anthropic此前承诺每月向SpaceX支付12.5亿美元GPU算力。Google新披露的云服务协议每月再付9.2亿美元(年化约110亿美元),两家AI实验室合计月付21.7亿美元,年化营收达260亿美元。Alphabet于2015年以约9亿美元入股SpaceX约7%,当前SpaceX目标IPO估值1.75万亿美元,其6.11%股份对应约1070亿美元,投资回报约97-119倍。业务转向显示AI算力正成为战略商品。 Rohan Paul : SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a... Anthropic Google 行业动态 部署/工程 推荐理由: SpaceX的GPU算力生意年收入260亿美元,比火箭发射还暴利,Google早年9亿投资如今价值近千亿,AI军备竞赛的最大赢家可能是马斯克。

Anthropic Google 行业动态 部署/工程
AI HOT ·

你的AI账单失控了。Cloudflare现在可以解决这个问题。

22:30 Cloudflare Blog 精选 71 Cloudflare AI Gateway新增实时消费限制功能,防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成,企业可以使用基于身份的预算和策略管理AI使用成本。 产品更新 部署/工程 推荐理由: Cloudflare AI Gateway 新加的实时花费限制,直接掐住 token 账单失控的命门,对重度依赖多模型的团队来说,这比任何新模型发布都更实在。

产品更新 部署/工程
AI HOT ·

Mocap 不需要套装、工作室或数千美元。 使用 @Viggle_PINOC,任何人都可以简单地拍摄自己,并将该视频转换为动作捕捉。 我们仍处于测试阶段,且对所有人完全免费。试试看,告诉我们你还想看什么!

22:41 ViggleAI @ ViggleAI 精选 65 独立开发者William : 🤓mocap搞起来。 现在这个时代真是太好了。手机拍个视频就能动作捕捉。 想要什么技能就拍一个。 产品更新 视频 推荐理由: 动作捕捉从动捕服变成手机自拍,Viggle 这个 Pinoc 工具把 mocap 的门槛从数千美元拉到零,做动画和 VTuber 的可以直接玩起来了。

产品更新 视频
AI HOT ·

一个非常狠的AI教学提示词:追问式检查清单教学

22:52 小互 @ xiaohu 精选 76 这是一则AI提示词,让AI扮演极度严格的老师,通过逐阶段教学、持续维护MD检查清单来确保用户真正理解。AI先让用户复述当前理解,再填补漏洞,并用开放式或选择题(随机选项顺序,提交前不公布答案)测试。教学必须覆盖问题本身、解决方案、宏观背景三个层面,并不断深挖“为什么”。仅当用户通过清单上所有项目的验证,会话才算结束。提示词强调对理解程度的主动验证,而非一次性灌输。 教程/实践 推荐理由: 这个 prompt 把一个温柔解惑的 AI 变成了不依不饶的严厉老师,直接复制就能让 AI 追着你问到底,适合每个经常「以为自己会了」的人。

教程/实践
AI HOT ·

Sir Demis Hassabis vs Sir Demis Hassabis

22:30 Gary Marcus:The Road to AI We Can Trust(RSS) 精选 59 DeepMind 大佬观点 现象/趋势 推荐理由: Gary Marcus 翻出 Hassabis 自己的话,两条 AI 时间线互相打脸,这对 DeepMind 的 AGI 叙事是个精准回击。

DeepMind 大佬观点 现象/趋势
AI HOT ·

Nemotron 3 Ultra 现已面向 Perplexity 和 Computer 上的 Pro 和 Max 订阅用户开放。 这是@nvidia 为长期运行的智能体打造的全新开源模型。

03:19 Perplexity @ perplexity_ai 精选 69 智能体 产品更新 开源/仓库 推荐理由: Nemotron 3 Ultra 加入 Perplexity,主打长任务代理且完全开放,Pro 用户点开侧边栏就能用,对重度依赖 AI 做多步工作流的人算个实在更新。

智能体 产品更新 开源/仓库
AI HOT ·

Gemma 4 QAT 模型:优化压缩以提升移动设备和笔记本电脑的能效

03:21 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 Google 发布 Gemma 4 QAT 模型,该模型通过量化感知训练(QAT)技术优化压缩,旨在提升移动设备和笔记本电脑上的运行效率与能效。文章来源于 Google 官方博客,介绍了这一面向移动端和笔记本端的模型优化方案。 Google 模型发布 端侧 部署/工程 推荐理由: Google 给 Gemma 4 做了量化感知训练版,在手机上跑能效提升明显,做移动端 AI 应用的直接下权重就能用,这周最实在的端侧优化。 03:21 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 Claude 是否增加了 rsync 中的错误? 一篇 Hacker News 热门帖子(105 分)提出了 Claude 是否导致 rsync 工具中 bug 增加的问题,并附有分析链接。 Anthropic 现象/趋势 编码 推荐理由: 不是给Claude泼脏水,而是用rsync项目真实数据拉警报,AI辅助也许正在增加低级bug,做底层工具的开发者该紧绷这根弦。 03:19 Perplexity @ perplexity_ai 精选 69 Nemotron 3 Ultra 现已面向 Perplexity 和 Computer 上的 Pro 和 Max 订阅用户开放。 这是@nvidia 为长期运行的智能体打造的全新开源模型。 智能体 产品更新 开源/仓库 推荐理由: Nemotron 3 Ultra 加入 Perplexity,主打长任务代理且完全开放,Pro 用户点开侧边栏就能用,对重度依赖 AI 做多步工作流的人算个实在更新。 01:50 Michael Truell @ mntruell 精选 80 与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"--不仅通过文本聊天,还能一起对着屏幕做手势、实时对话等。 Cursor : With Design Mode, you can now point, draw, or talk to update your UI. 智能体 产品更新 多模态 编码 推荐理由: Cursor 新加的 Design Mode 让改 UI 像跟同事比划屏幕一样自然,手势、画框、说话都能驱动 agent,AI 编程工具第一次有了‘面对面’的感觉。 01:20 Google AI @ GoogleAI 精选 78 Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等 Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA,可通过 Gemini Enterprise Agent Platform、Gemini API

Google 模型发布 端侧 部署/工程 Anthropic 现象/趋势 编码 智能体 产品更新 开源/仓库 多模态 MCP/工具 OpenAI 图像生成 行业动态 大佬观点
AI HOT ·

社区基于MiniCPM-V 4.6打造财务分析工具AccountingLLM

21:36 OpenBMB @ OpenBMB 精选 66 社区开发者使用面壁智能MiniCPM-V 4.6构建了AccountingLLM(quaesto.com),用于自动化财务文档分析。该工具可上传IPO招股书、年报或审计文件,自动从复杂PDF中提取财务表格、重建跨页表格、对照会计等式检查关键数据,并标记可疑条目供人工审核。开发者已将其商业化,成为实际可用的产品。 产品更新 多模态 行业动态 推荐理由: 这不是又一个AI读财报的demo,而是直接上线接客的商业产品。做财务、审计的可以试试它从招股书里自动扒表格和勾稽检查的实用性。

产品更新 多模态 行业动态