AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态，并提供来源链接以便深入阅读。

---

AI HOT · 2026-06-26 04:28

OpenAI 内部论文：Codex 已占 99.8% 内部输出 tokens，智能体正向全部门扩散

03:23 Rohan Paul @ rohanpaul_ai 精选 80 OpenAI 发布内部论文，显示 Codex 已成为公司主力 AI，产出 99.8% 内部输出 tokens，而一年前这一比例低于 10%。除工程部门外，法务、财务、招聘、支持及业务团队使用量快速增长。自 Aug-25 以来，非开发者个人使用增长 137 倍，组织使用增长 189 倍。重度用户日均运行约 71 小时代理任务，28.6% 的用户管理 5 个以上并发 agent，25.6% 的个体提交过超过 8 小时人工等价的任务。OpenAI 称，Agent 正使工作更复杂、更长期、更跨职能。 OpenAI : Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to... 智能体 OpenAI 论文/研究推荐理由： OpenAI 内部 agents 采用数据首次公开，非开发者使用暴增 137 倍，工作单元从“提问”变成了“分配任务”，这是 AI 融入日常运作的最强信号。 03:12 Midjourney @ midjourney 精选 67 Midjourney 带来两项更新。一是加入 `--preview` 参数可提前体验 V8.2 的美学与个性化效果；二是此前在 V8.1 推出的大批量草稿模式（生成 24 张低分辨率图，价格仅为标准 4 张的一半，点击 "Vary" 可升级为全分辨率）现在支持搭配 `--sref random` 使用，探索风格空间的速度比之前快 24 倍。 Midjourney : We've released a new big-batch draft mode for V8.1. This new mode lets you generate 24 lower resolution images at the ha... 产品更新图像生成推荐理由：新草稿模式让批量探索风格变得便宜又快速，配上 sref random 更是把试错效率拉满，设计师能直接用到工作流里。V8.2 预览只是小彩蛋，但暗示美学调校还在进化。 03:01 Hacker News 热门（buzzing.cc 中文翻译）精选 78 IBM 首度推出亚纳米级芯片技术 IBM 于 2026 年 6 月 25 日发布全球首款亚纳米级芯片技术，采用 0.7 nm（7 埃米）节点与全新三维纳米堆叠（nanostack）架构。指甲盖大小的芯片集成近 1000 亿个晶体管，密度约为 IBM 2021 年 2 nm 芯片的两倍。相比 2 nm 芯片，性能最高提升 50%，能效最高提升 70%。纳米堆叠架构还实现 SR

智能体 OpenAI 论文/研究产品更新图像生成推理数据/训练视频 GitHub 开源生态具身智能行业动态模型发布编码 Hugging Face Google 多模态安全/对齐评测/基准

AI HOT · 2026-06-26 04:28

Qwen-AgentWorld 开源：让 Agent 学会“先预测，再行动”

今日热点 TOP 1 1 5 信源 · 1天前

AI HOT · 2026-06-26 03:21

OpenRouter 零数据留存（ZDR）实践：97 款新模型，流量占比近半

04:07 OpenRouter：Announcements（RSS）精选 68 OpenRouter 的零数据留存（ZDR）保证用户提示词和模型响应不被存储，元数据一般安全。自 1 月以来新增 97 款支持 ZDR 的模型，月度 token 量增长 4.3 倍，约占全部路由流量一半。ZDR 在三个层面执行：账户级（整个供应商开启）、护栏级（按 API Key 或组织成员限定）、单次请求级（传参数仅路由至 ZDR 端点）。企业用户可灵活选择控制粒度，避免锁定单一供应商。教程/实践数据/训练推荐理由： ZDR 远不止“不存数据”这么简单，提示、响应、缓存的区分很多人没搞清楚。OpenRouter 的三层执行算是把自由度给足了，做合规服务的人可以仔细看看。

教程/实践数据/训练

AI HOT · 2026-06-26 02:15

思考即回忆：推理如何解锁LLM中的参数化知识

01:05 Google Research：Blog（网页）精选 69 Google Research研究发现，推理（chain-of-thought）能帮助大语言模型（LLM）回忆简单事实，即使这些事实无需复杂推导。在Gemini-2.5 Flash和Pro以及Qwen3-32B上，启用推理后模型能够回答原本无法直接回答的简单问题，pass@k显示正确事实存在于输出分布中。该现象由两个机制驱动：一是生成的推理token充当计算缓冲，允许模型进行隐藏计算以提取参数化知识；二是推理过程中产生的相关事实起到启动效应（factual priming），帮助模型激活正确答案。 Google 推理论文/研究推荐理由：发现一个反直觉现象，让模型推理能提升简单事实回忆，不是靠分步解题而是计算缓冲和事实预热，对理解模型知识召回机制很有启发，但中间步骤幻觉也带来风险。

Google 推理论文/研究

AI HOT · 2026-06-26 02:15

Figma在Config 2026押注人类判断，画布AI能力却来自第三方

01:06 The Decoder：AI News（RSS）精选 74 Figma在Config 2026将设计画布扩展至代码、动画、3D深度和着色器效果，并集成去年收购的Weave工作流系统。新功能包括Code Layers（代码与设计并存）、Motion动画、深度层、Shader及Generative Plugins。协作方面，团队可搜索复用AI提示词、保存工作流为技能、共享插件。Figma的AI功能依赖Anthropic、OpenAI和Google等外部模型，推理成本挤压利润率。同时，Anthropic等公司的竞争产品可直接生成界面，构成威胁。智能体 Anthropic 产品更新编码推荐理由：我认为Figma这波更新很务实，它没有硬扛AI生成界面的对手，而是把代码、动效、3D拉进画布，用人的判断驾驭AI。虽然利润被模型供应商挤压，但共享提示和工作流的设计让团队协作更高效，做设计和产品的值得细看。

智能体 Anthropic 产品更新编码

AI HOT · 2026-06-26 02:15

我们为你带来了新版 GPT-5.5 Instant，它现在聊起天来有趣多了。我们最常用的模型现在能更好地理解问题背后的意图，并相应地调整回应。它也能更可靠地处理复杂约束，让购物和本地推荐更加实用和连贯。今天向付费用户推送，明天向免费用户推送。

02:20 OpenAI @ OpenAI 精选 67 OpenAI 推理模型发布关联讨论 1 条 X：ChatGPT (@ChatGPTapp) 推荐理由： GPT-5.5 Instant 这次更新看似温和，但“更懂意图”和“复杂约束处理”的改进，对产品人和普通用户来说，可能比跑分更有用。

OpenAI 推理模型发布

AI HOT · 2026-06-26 02:15

在与Anthropic的纠纷中，NSA失去了对Mythos的访问权限

03:29 Hacker News 热门（buzzing.cc 中文翻译）精选 71 美国国家安全局（NSA）因与人工智能公司Anthropic的纠纷，失去了对Mythos系统的访问权限。 Anthropic 政策/监管行业动态推荐理由： NSA失去对Mythos的访问权，表面是商业纠纷，实则触及AI公司与情报机构合作的敏感边界，这件事很可能成为未来AI治理的一个关键参照点。

Anthropic 政策/监管行业动态

AI HOT · 2026-06-26 02:15

推出 Computer for Counsel。 Computer 现在连接了律师日常使用的研究数据库、文档工具和案件管理系统。可从中提取可引用来源：@midpageAI、@LegalZoom、@Docusign、@netdocuments 等。所有 Pro 和 Max 订阅用户均可使用。

03:44 Perplexity @ perplexity_ai 精选 65 产品更新搜索推荐理由： Perplexity 发布了面向法律行业的 Computer for Counsel，将研究数据库、文档工具和事务管理系统集成进 AI 搜索，律师可以一试。

产品更新搜索

AI HOT · 2026-06-26 01:08

Anthropic 推出 Claude Tag，构建人机协作团队

今日热点 TOP 2 1 4 信源 · 22小时前 2 Qwen-AgentWorld 开源：让 Agent 学会“先预测，再行动” 5 信源 · 23小时前

AI HOT · 2026-06-26 00:00

字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

22:31 公众号：火山引擎精选 74 在火山引擎Force大会，字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年，字节AI代码贡献率增长6倍，tokens消耗增长5倍，但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成，人均需求吞吐率仅提升60%。900次实验显示，主流Coding模型组合代码正确率超80%，但可交付性仅40-60分；结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发，能力沉淀至TRAE（日均Token消耗5.6万亿，增长50倍），并推出TRAE Work。大佬观点现象/趋势编码推荐理由：洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲，尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证，是所有推 AI 编程的团队必看的复盘。

大佬观点现象/趋势编码

AI HOT · 2026-06-26 00:00

Mistral AI 为 Connectors 推出多项安全与可控新能力

23:59 Mistral AI：News（网页）精选 62 2026年6月24日，Mistral AI 发布 Connectors 多项新能力：Enriched admin controls（GA）支持按工作空间设置连接器访问权限并单独开关工具；API keys with connector scopes（GA）防止自动化 AI 工作负载中身份冒充；Multi-account connectors（GA）允许单个连接器绑定多个账户；Connectors Debugger（公开预览）对 MCP 连接器进行端到端根因分析；Connectors in Vibe Code（GA）和 Connectors in Workflows（公开预览）分别允许在开发者界面复用连接器及支持长时间运行任务不中断。产品更新推荐理由： Mistral 这次把连接器从演示级提升到生产级，关键不只是新功能，而是解决了企业代理在权限、身份和故障排查上的真实痛点，做平台工程的人会觉得踏实了不少。 22:31 公众号：火山引擎精选 74 字节跳动技术副总裁洪定坤：AI Coding 的实践与探索在火山引擎Force大会，字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年，字节AI代码贡献率增长6倍，tokens消耗增长5倍，但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成，人均需求吞吐率仅提升60%。900次实验显示，主流Coding模型组合代码正确率超80%，但可交付性仅40-60分；结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发，能力沉淀至TRAE（日均Token消耗5.6万亿，增长50倍），并推出TRAE Work。大佬观点现象/趋势编码推荐理由：洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲，尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证，是所有推 AI 编程的团队必看的复盘。 22:29 Hacker News 热门（buzzing.cc 中文翻译）精选 78 里德·霍夫曼称SpaceX"不是一家人工智能公司"，xAI则是"彻底的灾难" LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”，6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”；xAI则是“彻底的灾难”，所有11位联合创始人已离职，Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型，理由仅为Amazon CEO报告Fable 5存在jailbreak漏

产品更新大佬观点现象/趋势编码安全/对齐 OpenAI 推理智能体图像生成多模态部署/工程论文/研究开源/仓库端侧模型发布语音 GitHub 开源生态评测/基准视频行业动态政策/监管 Hugging Face 教程/实践 Anthropic

AI HOT · 2026-06-26 00:00

NVIDIA NeMo AutoModel：一行代码加速Transformer MoE模型微调

00:15 Hugging Face：Blog（RSS）精选 66 NVIDIA NeMo AutoModel 是基于 Transformers v5 的开源库，添加 Expert Parallelism、DeepEP 融合 all-to-all 调度和 TransformerEngine 内核。在 MoE 模型微调中，相比原生 v5，训练吞吐量提升 3.4–3.7 倍，GPU 内存减少 29–32%，仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B A55B 时，v5 因内存不足无法运行，而 AutoModel 凭借 EP=64 专家并行使训练可行。单节点 30B MoE 模型（如 Qwen3-30B-A3B）同样获得可量化的性能优势。开源/仓库教程/实践数据/训练推荐理由：英伟达的 NeMo AutoModel 把 MoE 模型微调速度提高了三倍多，内存省了近三分之一，代码只需改一行 import，做训练的可以立刻升级。

开源/仓库教程/实践数据/训练

AI HOT · 2026-06-26 00:00

FFASR 排行榜发布：真实远场条件下 ASR 评测

00:15 Hugging Face：Blog（RSS）精选 61 Treble Technologies 与 Hugging Face 联合推出 FFASR（Far-Field ASR）排行榜，这是首个开源社区驱动的真实远场声学条件 ASR 评测基准。传统近场评测无法反映混响、背景噪声和麦克风距离带来的性能下降。FFASR 使用混合波模拟引擎生成声学数据，涵盖 14 种房间（20–470 m³）和三个信噪比级别（远场高 SNR >14 dB、中 SNR 8–12 dB、低 SNR <6 dB），加上近场干燥条件，共四类条件决定主排名。另有实验室实测/模拟验证轨道和移动声源 beta 版。性能指标同时报告词错误率（WER）和实时因子（RTFx，在 NVIDIA L4 GPU 上评估）。未来将支持多说话人场景、麦克风阵列和回声消除。 Hugging Face 评测/基准语音推荐理由：远场语音的‘实验室-生产’性能差终于有了量化指标，这个排行榜把 ASR 的真实世界鲁棒性公开化，做语音产品的团队该看看。

Hugging Face 评测/基准语音

AI HOT · 2026-06-26 00:00

Gemini 3.5 Flash 中的计算机使用

05:29 Hacker News 热门（buzzing.cc 中文翻译）精选 71 Google 将计算机使用（Computer use）作为内置工具集成至 Gemini 3.5 Flash，使开发者能构建跨浏览器、移动端和桌面环境的智能体。此前该功能仅作为独立模型在 Gemini 2.5 中提供，现已原生整合至主 Flash 模型。开发者可通过 Gemini API 及 Gemini Enterprise Agent Platform 调用。安全方面，模型采用针对性对抗训练降低提示注入风险，并新增两项可选企业级保护：要求用户确认敏感操作、检测到间接提示注入时自动停止。该能力在持续软件测试、跨应用知识工作等长周期企业自动化场景中表现更优。（198字）智能体 Google MCP/工具模型发布推荐理由： Computer Use 从独立模型变成了 Flash 的内置工具，这对做跨平台 agent 的开发者来说是个分水岭，意味着自动化能力会更快渗透到更多产品里。

智能体 Google MCP/工具模型发布

AI HOT · 2026-06-25 21:16

里德·霍夫曼称SpaceX"不是一家人工智能公司"，xAI则是"彻底的灾难"

22:29 Hacker News 热门（buzzing.cc 中文翻译）精选 78 LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”，6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”；xAI则是“彻底的灾难”，所有11位联合创始人已离职，Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型，理由仅为Amazon CEO报告Fable 5存在jailbreak漏洞，称此举“专断随意”。Hoffman认为Anthropic和OpenAI均有巨大发展空间，但Cursor可能已过巅峰。他建议年轻人不要抵制AI。大佬观点安全/对齐现象/趋势推荐理由： Reid Hoffman 对 xAI 和 SpaceX 的批评几乎不留情面，这种硅谷核心人物的公开呛声本身就值得一读，他对监管干预的担忧和对 Gen Z 的劝诫也很有现实感。

大佬观点安全/对齐现象/趋势

AI HOT · 2026-06-25 18:00

OpenAI 与 Broadcom 发布面向 LLM 推理的定制芯片 Jalapeño

21:01 OpenAI：官网动态（RSS · 排除企业/客户案例）精选 55 OpenAI 与 Broadcom 联合推出 Jalapeño，一款专为大语言模型（LLM）推理优化的定制 AI 芯片，旨在提升 AI 系统的性能、效率与规模。 OpenAI 产品更新推理推荐理由： OpenAI 第一次发布自研推理芯片，和博通合作把算力账算得更细，对规模化推理成本的影响比参数更新更深远。

OpenAI 产品更新推理

AI HOT · 2026-06-25 12:00

Seed2.1 正式发布，深入 AI 生产力

3 4 信源 · 1天前

AI HOT · 2026-06-25 10:29

OpenRouter推出统一图像API

19:31 OpenRouter：Announcements（RSS）精选 73 OpenRouter推出统一图像API，整合Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft、xAI等30+模型。新API提供标准化请求格式，通过`/api/v1/images/models`端点返回每个模型的分辨率、宽高比、输出数量、输入参考图数量、种子等能力描述；通过`/api/v1/images/models/{id}/endpoints`端点获取具体服务商的定价与参数支持（如Seedream 4.5每张$0.04、FLUX.2 Pro每百万像素$0.03、GPT-5.4 Image 2按token计费）。OpenAI的GPT 5系列图像模型支持SSE流式预览，启用`"stream": true`即可边生成边返回预览。新图像模型将仅添加至专用API，建议现有用户切换。智能体产品更新图像生成多模态关联讨论 1 条 X：OpenRouter (@OpenRouter) 推荐理由： OpenRouter 把 30+ 图像模型收进一个 API，参数自动发现和流式预览让频繁切换模型的开发者省去不少适配麻烦，尤其对 Agent 工作流很友好。

智能体产品更新图像生成多模态

AI HOT · 2026-06-25 08:13

火山引擎推出Agent Ready基础设施，AgentKit与ArkClaw企业版升级

18:31 公众号：火山引擎精选 66 火山引擎在FORCE大会推出面向企业智能应用的Agent Ready基础设施，构建AI云与Agent三层架构。AgentKit升级提供Identity、Runtime、Sandbox、Evaluation等模块，实现Agent可靠、可控、可衡量。Identity已接入数千家身份体系，Runtime支持长程任务和分钟级12万沙箱并发。ArkClaw企业版集成Agent广场、技能中心与企业知识库，支持IDP/SSO/OAuth及飞书、钉钉等IM入口统一管控。实践案例：海底捞门店经营Agent将小时级工作压缩到分钟级，人工跟进时长缩减70%，巡检满意度提升50%；创维酷开借助ArkClaw终端版打造AIOS，Token消耗节省50%，支撑百万级终端。智能体产品更新部署/工程推荐理由： Agent 从聊天机器人到企业生产工具，缺的不是模型能力而是基础设施。火山引擎这套 AgentReady 架构把身份、沙箱、评测串了起来，是企业 AI 落地的关键一步。

智能体产品更新部署/工程

AI HOT · 2026-06-25 06:00

DFlash：块扩散草稿模型实现最高15倍吞吐量提升

15:37 MarkTechPost（RSS）精选 74 DFlash 由 UC San Diego 团队提出，是一种用于投机解码的轻量块扩散草稿模型。它一次前向推理生成整块 token，再由目标模型并行验证，保证输出无损。相比 EAGLE-3，DFlash 实现最高 2.5 倍加速，在 Qwen3-8B 等多种模型上平均无损加速超过 6 倍（MATH-500 达 6.08×）。在 NVIDIA Blackwell 上（TensorRT-LLM），gpt-oss-120b 模型吞吐量提升最高 15 倍，约为 EAGLE-3 的 1.5 倍。核心创新是将目标模型多层隐藏特征注入草稿模型每一层的 Key-Value 投影，使接受长度随草稿深度增长。推理论文/研究部署/工程推荐理由： DFlash把扩散模型引入推测解码草案阶段，一次并行生成整块token，单流加速最高6倍，NVIDIA实测吞吐量提升15倍，推理成本下降幅度很大，部署大模型的团队可以立刻关注。

推理论文/研究部署/工程