AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

Sensor Tower:OpenAI 旗下 ChatGPT 月活已破 10 亿,史上最快

10:09 IT之家(RSS) 精选 75 据市场情报机构 Sensor Tower 估计,OpenAI 旗下 ChatGPT 全球月活跃用户在 2025 年 5 月突破 10 亿,成为达成此里程碑最快的应用,增速超过 Google Maps、TikTok 等。同期,其竞争对手 Anthropic 的 Claude 月活达 5600 万,同比增幅约 640%,增长势头迅猛。数据显示,部分用户已开始在 Claude 与 ChatGPT 间切换使用。在达成用户里程碑之际,Anthropic 已秘密递交 IPO 申请,OpenAI 也计划筹备上市。 Anthropic OpenAI 现象/趋势 行业动态 推荐理由: ChatGPT 月活破 10 亿是 AI 从工具变成基础设施的关键节点,但 Claude 年增 640% 信号更凶猛,做 AI 应用的人得开始看谁在蚕食谁的时间。

Anthropic OpenAI 现象/趋势 行业动态
AI HOT ·

斯坦福大学法学院研究:人工智能的表现优于法学教授

11:05 Hacker News 热门(buzzing.cc 中文翻译) 精选 75 斯坦福大学法学院的一项研究表明,人工智能的表现优于法学教授。该发现引发了广泛关注,在Hacker News平台获得了104个Points。 推理 论文/研究 推荐理由: 斯坦福法学院自己下场测的,AI在法律考试上超过教授,虽然不是什么新题型,但官方自己出这种结果,对法律科技赛道是个真信号。

推理 论文/研究
AI HOT ·

世界模型与语言模型:论具体推理与抽象推理的互补性

12:42 HuggingFace Daily Papers(社区热门论文) 精选 70 本研究探讨了世界模型与多模态大语言模型在预测未来状态时的互补性。世界模型可生成具体的视觉未来轨迹,但可能视觉合理却任务错误;多模态大语言模型则擅长抽象推理。为此,研究提出了“受控的具体推理”框架,并构建了VRQABench和OpenWorldQA两个基准。同时,提出了Privileged-Future On-Policy Self-Distillation(PF-OPSD)方法,该方法在训练时利用真实未来视频作为特权上下文评估推理轨迹,但部署时无需真实未来。实验结果显示,PF-OPSD在两个基准上分别比基线高出10.6%和10.9%,并提升了对噪声或冲突轨迹的鲁棒性。 智能体 多模态 开源/仓库 推理 推荐理由: 世界模型靠视觉预测,语言模型靠抽象推理,这篇把两者真正拧在一起了。用未来视频做自我蒸馏提升 10%,还给全开源,做 agent 决策的可以认真看看‘什么时候不信自己的眼睛’是怎么训出来的。

智能体 多模态 开源/仓库 推理
AI HOT ·

消息称 DeepSeek 首轮融资拟筹集 500 亿元,腾讯、宁德时代等参投

13:09 IT之家(RSS) 精选 70 DeepSeek 计划在首轮融资中从腾讯、宁德时代等投资方处筹集约 500 亿元人民币。融资落地后,其投后估值预计在 3500 亿至 4000 亿元。创始人梁文峰将出资 200 亿元,腾讯和宁德时代分别拟投资 100 亿元和 50 亿元,成为最大外部投资者。DeepSeek 去年凭借 V3 大模型与 R1 推理模型获得广泛认可。此次融资凸显了中国正打造从大模型到算力能源基建的全链条 AI 产业。 DeepSeek 行业动态 推荐理由: DeepSeek 第一轮就 500 亿、估值直奔 4000 亿,腾讯和宁德时代入局,这已经不是一家公司的融资,而是中国 AI 产业链上下游的一次正式组队。

DeepSeek 行业动态
AI HOT ·

官方 Hermes Agent 桌面应用现已推出!

14:06 SiliconFlow @ SiliconFlowAI 精选 71 Nous Research : The next evolution of Hermes Agent is here! Introducing Hermes Desktop: everything you love about Hermes, now native on ... 智能体 产品更新 开源生态 推荐理由: Hermes 的桌面版把 Agent 能力直接装进本地,不用折腾环境,开发者可以立刻体验在 GTC 上演示的体验,公测阶段值得尝鲜。

智能体 产品更新 开源生态
AI HOT ·

@karpathy 的 llm-wiki 在几周内获得了 5,000+ 颗星。 其理念是:停止在每个会话中重新发现知识。让一个大语言模型构建并维护一个维基,每次使用时它都会变得更智能。 以下是如何使用 @opencode + @justsisyphus OMO + SiliconFlow 构建你自己的版本 🧵

14:36 SiliconFlow @ SiliconFlowAI 精选 67 开源生态 教程/实践 推荐理由: 把 karpathy 的 llm-wiki 创意拆成了可复制的 recipe,跟着教程用 SiliconFlow + opencode + OMO 就能搭一个自进化的知识库,相当实用。

开源生态 教程/实践
AI HOT ·

Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56%

17:51 Anthropic:Research(发表成果 · 网页) 精选 69 Anthropic 分析 2025 年 3 月至 2026 年 3 月间 832 个被封禁的恶意账户,映射至 MITRE ATT&CK 框架。67.3% 使用 AI 编写恶意软件,6.5% 用于横向移动。六个月间中高风险攻击者占比从 33% 升至 56%。AI 用于账户发现增长 8.9%,AI 辅助钓鱼下降 8.6%。传统基于技术数量或平台(Claude Code、API、聊天界面)的威胁评估失效,而 MITRE ATT&CK 框架尚未收录此类智能体编排行为。 Anthropic 安全/对齐 论文/研究 关联讨论 1 条 Anthropic:Newsroom(网页) 推荐理由: 这份报告用一整年的真实案例揭示了AI攻击正从初始入侵转向深度潜伏,连MITRE ATT&CK框架都开始跟不上。安全从业者值得一读,它告诉你下一波威胁长什么样。

Anthropic 安全/对齐 论文/研究
AI HOT ·

这项行政令是加强美国AI领导地位的重要一步。 我们期待与白宫合作,支持其实施。 https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/

05:55 Anthropic @ AnthropicAI 精选 69 Anthropic 政策/监管 行业动态 关联讨论 5 条 TechCrunch:AI(RSS) The Verge:AI(RSS) Bloomberg:Technology(RSS) IT之家(RSS) X:Rohan Paul (@rohanpaul_ai) 推荐理由: Anthropic 对白宫 AI 行政令的官方表态,信号意义大于实质内容,但头部公司主动拥抱政策制定是趋势,值得留意后续落地细节。

Anthropic 政策/监管 行业动态
AI HOT ·

天气预报速度比传统超级计算机快数千倍。听听Kenji Takeda在#MSBuild微软研究实验室关于Aurora的分享。了解更多:https://msft.it/6018vjGUA

06:00 Microsoft Research @ MSFTResearch 精选 72 Microsoft 多模态 论文/研究 推荐理由: 微软把天气预报推到了推理速度比超算快数千倍,这在气象AI里算是代际提升,虽然离普通人远,但对气候建模和极端天气预警是实实在在的突破。

Microsoft 多模态 论文/研究
AI HOT ·

智能体工程实战窍门全录

09:13 meng shao @ shao__meng 精选 75 该内容源自@mvanhorn的分享,介绍了“智能体工程”如何重塑软件开发。其核心是从“人主导编码”转向“人主导方向、智能体执行”,中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环,核心是让plan.md约束智能体行为。分享者总结了22条实战技巧,涵盖规划、并行执行、输入方式、远程控制等方面,并列出了完整的工具栈。 Matt Van Horn : http://x.com/i/article/2061440101411102721 智能体 教程/实践 编码 部署/工程 推荐理由: mvanhorn 三个月从零到 27K stars 的实战手册,22 条 hack 把 agentic 开发从规划到执行到语音全打通,开发者能直接套用。

智能体 教程/实践 编码 部署/工程
AI HOT ·

NVIDIA DGX Station 系统正开始送达开发者和研究人员的办公桌。📦 企业团队可以本地部署数据中心级性能,搭载 GB300 的系统正从华硕、戴尔、技嘉、惠普、微星和超微等合作伙伴处发货。 👉 阅读博客:https://nvda.ws/4x3VdBr

04:32 NVIDIA @ nvidia 精选 65 产品更新 端侧 部署/工程 推荐理由: 把数据中心算力塞进桌面的 DGX Station 开始发货了,GB300 加持,对需要本地大模型训练的研究员和独立开发者来说是个硬核生产力工具,以前不敢想的本地部署现在可以搞。

产品更新 端侧 部署/工程
AI HOT ·

构建用于科学发现的自主智能体?🧬🤖 @GoogleDeepMind Science Skills 现已在 GitHub 上发布。我们已开源这个专用工具包,以科学基础和更高的 token 效率加速您的智能体工作流。 立即下载 ↓ https://github.com/google-deepmind/science-skills

05:47 Google AI Developers @ googleaidevs 精选 74 智能体 DeepMind 产品更新 开源生态 推荐理由: DeepMind 把这个科学 agent 工具包开源了,核心是给 agent 工作流加科学基础、提升 token 效率,做 AI for Science 的可以直接 fork 试手,本周最值得上手的工具之一。

智能体 DeepMind 产品更新 开源生态
AI HOT ·

Codex 中的角色专属插件围绕团队实际工作构建。 数据分析、创意制作和产品设计插件为 Codex 提供了创建报告、创意方向和原型的工具与上下文。 由 OpenAI 团队构建并使用。

03:25 OpenAI Developers @ OpenAIDevs 精选 69 OpenAI 产品更新 编码 关联讨论 1 条 X:OpenAI (@OpenAI) 推荐理由: OpenAI给Codex装了三个团队专用插件,数据分析、创意生产和产品设计直接内置,如果你团队在用Codex,这是能省事的小更新。

OpenAI 产品更新 编码
AI HOT ·

宣布与 @Microsoft 的新合作 组织现在可以在 Replit 中构建内部工具、工作流或数据仪表板,并直接发布到 Microsoft Fabric,内置安全、身份验证和治理功能。

03:56 Replit ⠕ @ Replit 精选 70 Microsoft 产品更新 部署/工程 推荐理由: 对同时用 Replit 和 Microsoft Fabric 的企业来说,这个集成省了一步繁琐的部署工作,把内部工具开发到上线的链路压短了一截,但如果你没用过 Fabric 就不会有感知。

Microsoft 产品更新 部署/工程
AI HOT ·

如何让 Claude Code 在交回工作前检查自己的成果? 看看如何编码你的手动检查,让 Claude 自己关闭反馈循环:

04:24 ClaudeDevs @ ClaudeDevs 精选 73 智能体 Anthropic 教程/实践 编码 推荐理由: 如果你用Claude Code写代码,这个官方视频值得立刻打开——它教你把手动检查编码进去,让Claude自己形成反馈循环,能省掉大量反复修改的时间。

智能体 Anthropic 教程/实践 编码
AI HOT ·

Alphabet拟融资800亿美元 Anthropic提交IPO申请

03:20 Bloomberg:Technology(RSS) 精选 75 Alphabet宣布拟通过股权融资800亿美元,用于扩展AI基础设施。Anthropic已秘密提交IPO申请,在上市竞赛中领先于竞争对手OpenAI。此外,SpaceX正与华尔街机构协商其IPO的承销费用,HPE则因AI基础设施需求旺盛,年度销售预期超出市场估计。 Anthropic OpenAI 行业动态 部署/工程 关联讨论 1 条 Bloomberg:Technology(RSS) 推荐理由: Alphabet 80B的AI基建赌注说明巨头们在把AI当基础设施砸钱,Anthropic抢在OpenAI前秘密IPO也是重要信号。两件事放在一起看,AI行业的资本逻辑正在从讲故事转向抢位子。

Anthropic OpenAI 行业动态 部署/工程
AI HOT ·

Aleph 2.0 现已通过 Runway API 提供。将精准视频编辑直接集成到您的应用、产品和平台中。支持在多镜头序列中编辑最长 30 秒、1080p 分辨率的视频,仅修改您想要的部分。 请通过以下链接开始使用。

04:06 Runway @ runwayml 精选 73 产品更新 视频 推荐理由: Runway把Aleph 2.0的视频编辑能力放到了API里,做视频工具的同学可以直接拿来用了,1080p 30秒还支持多镜头,以前要写一堆处理逻辑的功能现在一个API调用搞定。

产品更新 视频