AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态，并提供来源链接以便深入阅读。

---

AI HOT · 2026-07-02 19:10

推出 ZCode，GLM-5.2 的官方开发环境 - GLM Coding Plan 订阅用户：现可在 ZCode 获得 1.5 倍使用配额 - 支持 BYOK：可与您现有的订阅和 API 配合使用 - 适用于 macOS、Windows 和 Linux 立即下载：http://zcode.z.ai/en

00:07 Z.ai @ Zai_org 精选 67 产品更新编码推荐理由：智谱为 GLM-5.2 推出官方 IDE，1.5 倍配额和自带密钥对已有订阅的人挺实用，但整体只是常规产品完善，算不上行业级事件。

产品更新编码

AI HOT · 2026-07-02 19:10

xAI 发布 Voice Agent Builder 测试版

00:20 xAI：News（网页）精选 77 xAI 推出 Voice Agent Builder 测试版，这是一个基于 Grok Voice 的无代码平台，可在两分钟内创建生产级语音智能体。它集成电话、知识检索、工具、MCP、Guardrails 及可观测性，支持连接现有 SIP 号码、API 和 WebSocket，采用语音到语音路径。在 τ-voice Bench 上，Grok Voice Think Fast 1.0 得分 67.3%，领先 Gemini 3.1 Flash Live（43.8%）和 GPT Realtime 1.5（35.3%）。定价为每分钟音频 0.05 美元、电话费 0.01 美元，提供 80+ 种语音及声音克隆，每个账户附赠一个免费电话号码。智能体 MCP/工具 xAI 产品更新关联讨论 1 条 X：xAI (@xai) 推荐理由： xAI 用 Grok Voice 原生的语音到语音路径，把生产级语音代理的搭建门槛降到了无代码、两分钟，计费也简单，做语音业务的人值得试试。

智能体 MCP/工具 xAI 产品更新

AI HOT · 2026-07-02 18:00

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

16:32 MarkTechPost（RSS）精选 73 NVIDIA 发布 Nemotron-Labs-TwoTower，基于冻结的自回归骨干 Nemotron-3-Nano-30B-A3B 的扩散语言模型。采用双塔架构：上下文塔冻结，降噪器塔训练，通过层对齐交叉注意力和状态播种协作。在 2×H100 上 BF16 评估，保留 98.7% 的 AR 基线质量，生成吞吐量提升 2.42 倍（γ=0.8，块大小 S=16）。降噪器在约 2.1T token 上训练，骨干使用 25T token 预训练。总参数约 60B，每 token 活跃参数约 3B/塔。支持扩散、模拟 AR 和 AR 三种解码模式。开源生态推理模型发布部署/工程推荐理由： NVIDIA这个TwoTower把扩散解码接在已有的AR骨干上，几乎无损质量却让吞吐翻倍，并且开源可商用，对批量文本生成的团队是实在的加速工具。

开源生态推理模型发布部署/工程

AI HOT · 2026-07-02 18:00

OpenAI论文揭示GPT-5.6三个Pro变体，打破单一顶级策略

18:10 The Decoder：AI News（RSS）精选 70 OpenAI论文首次列出GPT-5.6的三个Pro变体：Luna Pro、Terra Pro和Sol Pro，取代以往单一Pro模式。在基因组学基准中，Sol Pro通过率31.5%居60个测试模型之首，领先标准Sol（28.7%）和Claude Opus 4.8（16.0%）。Pro相比标准版本提升逐级递减：Luna Pro提升7.1个百分点（16.5%→23.6%），Terra Pro提升5.2（23.3%→28.5%），Sol Pro仅提升2.8（28.7%→31.5%）。Terra Pro（28.5%）几乎与标准Sol（28.7%）持平。论文未披露Pro运行的token用量，也不清楚该分层是否会在ChatGPT中实际推出。 OpenAI 推理行业动态推荐理由：论文意外曝光 GPT-5.6 Pro 将有三个变体，Pro 不再只是一个最强模型，而是让用户按推理需求选版本，这才是匹配 200 美元月费该有的逻辑。

OpenAI 推理行业动态

AI HOT · 2026-07-02 17:11

亚马逊 AWS 砸 10 亿美元，派遣工程师进驻客户公司

15:03 IT之家（RSS）精选 70 亚马逊 AWS 宣布设立新部门，组建前置驻场工程师团队，先期投入 10 亿美元（约 67.97 亿元人民币）。团队分批派驻客户企业，每批 5-6 组工程师，驻场周期 45 天，协助客户落地人工智能软件与智能体应用。该模式在 Palantir、Salesforce、Anthropic、谷歌云等企业已有先例，领英数据显示 2023 至 2025 年间同类岗位需求增长 42 倍。新部门员工规模将达数千人，首批客户包括 NBA 与理光。行业动态部署/工程推荐理由： AWS 砸 10 亿美元建驻场工程师团队，帮客户 45 天落地 AI 智能体。这不是卖云资源，是卖业务结果，对考虑用 AI 的企业是个信号，巨头开始贴身服务了。

行业动态部署/工程

AI HOT · 2026-07-02 15:57

mattpocockuk 的 /writing-great-skills：编写可预测 AI Skill 的指南

09:33 meng shao @ shao__meng 精选 75 mattpocockuk 的 /writing-great-skills 成为其最常调用的 Skill，指导如何编写稳定可预测的 AI Skill。核心：以过程可预测为目标；区分 model-invoked（自动触发）与 user-invoked（用户调用），description 应作触发器；采用三层信息结构（主步骤、参考、外部文件）实现渐进式披露；每步骤需明确完成标准；拆分 Skill 是为了控制模型注意力；利用 leading word 压缩行为要求。同时诊断五种失败模式：Premature completion、Duplication、Sediment、Sprawl、No-op，并提供 No-op 测试作为判断句子是否有效的标准。 Matt Pocock : /writing-great-skills is quickly becoming my most often-invoked skill It's just really good at writing skills, guys. npx... 智能体 GitHub 教程/实践推荐理由： Matt Pocock 把写 Skill 从玄学变成了可拆解的工程，其中领先词和完成标准这两个概念，能立刻让你的自定义工具行为更稳定，搞 Agent 的都应该试一下。

智能体 GitHub 教程/实践

AI HOT · 2026-07-02 15:57

美团 LongCat-2.0 正式发布：国产算力集群训练的万亿参数大模型

12:00 公众号：龙猫LongCat（美团）精选 82 美团于6月30日发布新一代万亿参数大模型LongCat-2.0并开源。总参数1.6T，平均激活约48B，原生支持1M超长上下文，在五万卡国产算力集群上完成全流程训练与推理。采用LSA稀疏注意力、零计算专家、ScMoE及MOPD多专家融合（Agent/Reasoning/Interaction三组专家）架构。评测中SWE-bench Pro获59.5，SWE-bench Multilingual获77.3。预览版已通过OpenRouter和longcat.ai开放，月调用量跻身OpenRouter全球前三。开源生态推理模型发布编码关联讨论 9 条 X：硅基流动 SiliconFlow (@SiliconFlowAI) X：美团 LongCat (@Meituan_LongCat) Hacker News 热门（buzzing.cc 中文翻译） X：Emad Mostaque (@EMostaque) IT之家（RSS） X：邵猛 (@shao__meng) X：Testing Catalog (@testingcatalog) 公众号：卡尔的AI沃茨 X：Rohan Paul (@rohanpaul_ai) 推荐理由：国产算力上首个全流程自训的万亿开源模型，1M上下文和动态专家架构直指Agentic Coding场景，OpenRouter调用量已经冲到前三，不是Demo是生产力。

开源生态推理模型发布编码

AI HOT · 2026-07-02 10:26

库克与欧盟科技主管就新版Siri AI举行建设性会谈

08:03 IT之家（RSS）精选 72 苹果CEO库克与欧盟科技事务负责人维尔库宁就新版Siri AI在欧推出举行建设性视频会议。新版Siri将转为可调用用户个人数据的聊天机器人，但因《数字市场法》互操作义务苹果拒绝向竞争对手开放同等数据权限，暂不在欧盟iPhone和iPad上推出。苹果提出“可信系统代理”方案，拟在设备与第三方AI模型间增加软件层，但未开发，并要求18个月监管宽限期，遭欧盟拒绝。欧盟收到数百封消费者邮件及死亡威胁。政策/监管行业动态推荐理由：苹果与欧盟围绕Siri AI的监管博弈，表面是互操作义务之争，实则关乎AI巨头在数据隐私和市场准入间的平衡，对全球科技政策都有风向标意义。

政策/监管行业动态

AI HOT · 2026-07-02 10:26

Anthropic在Claude Code中植入隐写术代码识别中国用户

08:20 公众号：数字生命卡兹克精选 84 Anthropic在Claude Code中植入隐写术：读取本地时区（Asia/Shanghai或Asia/Urumqi）和ANTHROPIC_BASE_URL环境变量，与一份经base64+XOR（密钥91）加密的147个域名列表（含美团、字节跳动、月之暗面等）比对，识别中国用户。识别后，在请求发送前将系统提示词中日期字符串的单引号（U+0027）替换为其他Unicode字符，连字符改为斜杠，作为2-3比特分类标记传回服务器。该隐蔽行为被社区逆向发现后引发争议，被认为破坏用户信任。 Anthropic 安全/对齐行业动态关联讨论 5 条 X：小互 (@xiaohu) X：卡兹克 (@Khazix0918) X：邵猛 (@shao__meng) IT之家（RSS） The Decoder：AI News（RSS）推荐理由： Anthropic用隐写术在Claude Code里埋标记的行为，让我对闭源开发者工具的信任打了一个巨大的问号，这事比普通地域封锁严重得多，因为它在不该碰的地方动了手脚。

Anthropic 安全/对齐行业动态

AI HOT · 2026-07-02 08:55

AI Safety Memes 推文指出，AI 刚刚解决了 9 个未解决的数学问题，但全球没有记者报道。引用 @WeinsteinOmri 的推文称，采用"prover-verifier"LLM 循环的方法，成功解决了理论计算机科学中 9 个重大开放问题，其中包括一个困扰其长达 2 年的难题。该研究由哥伦比亚大学合作者完成，并计划将这一方法扩展到所有科学领域。

06:59 AI Notkilleveryoneism Memes ⏸️ @ AISafetyMemes 精选 76 Omri Weinstein : Even @OpenAI's recent Erdős breakthrough didn't convince me that LLMs can do general math research. This changed my mind... 安全/对齐推理论文/研究推荐理由：如果属实，这将是 AI 首次批量解决实质性开放数学问题，但消息仅来自推文声明，未见论文或代码，现在兴奋还太早。

安全/对齐推理论文/研究

AI HOT · 2026-07-02 04:17

Acti 将 AI 智能体直接放入手机键盘

01:58 TechCrunch：AI（RSS）精选 72 新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘，可代替用户在应用中执行操作。核心功能 Skills 允许用自然语言创建快捷方式，如长按 T 键翻译消息、C 键发送会议链接。早期测试者两周内创建超 1000 个 Skills。采用本地优先架构，默认不访问私人消息。公司获 530 万美元种子轮融资，由 BITKRAFT Ventures 领投，现已开放下载。智能体 Google 产品更新端侧推荐理由： Acti 想用 AI 代理重塑手机键盘，把 Gemini 塞进输入法，离不离开 App 都能用 AI 的思路很讨巧，但换键盘的阻力不小，目前更像一个有趣的试验品。刚拿到 530 万美元种子轮，有试错空间。

智能体 Google 产品更新端侧

AI HOT · 2026-07-02 04:17

NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews（短视频概览）功能。该功能可将复杂资料自动转化为 60 秒竖屏视频，深入讲解任意概念。此前，这一功能已面向 Google AI Ultra 和 Pro 订阅者（移动端及 Web）推出，免费用户即将可用。

03:55 NotebookLM @ NotebookLM 精选 68 NotebookLM : Doom scrolling but make it educational 🤓 Introducing Short Video Overviews in NotebookLM! Turn your most complex source... Google 产品更新视频推荐理由： NotebookLM 把资料源变成 60 秒竖屏视频，想法不新但落地很实用，学生和内容创作者可能会高频用上，只是颠覆性谈不上。

Google 产品更新视频

AI HOT · 2026-07-02 01:27

Claude Science 科研工作台正式上线

01:32 Anthropic：Newsroom（网页）精选 66 Anthropic 推出 AI 科研工作台 Claude Science，整合常用工具与计算资源，支持从文献分析到多步骤研究的全流程。提供超 60 项预配置技能与连接器，覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等领域；可在macOS/Linux本地运行，或通过SSH/HPC远程使用。生成含代码和环境的可审计成果（3D蛋白质结构、基因组浏览器轨迹等），内置reviewer agent自动检查引用与计算错误。通过NVIDIA BioNeMo接入Evo 2、Boltz-2等模型，也支持连接自有模型与管道。今日以beta版面向Claude Pro、Max、Team和Enterprise用户开放。智能体 Anthropic MCP/工具产品更新关联讨论 2 条 X：Claude (@claudeai) Hacker News 热门（buzzing.cc 中文翻译）推荐理由： Anthropic 为科学家打造了一个整合 60+ 技能、可管理计算和审计输出的 AI 工作台，让 AI 从顾问变成可复现的实验合作者。

智能体 Anthropic MCP/工具产品更新

AI HOT · 2026-07-02 00:00

用 shot-scraper video 让 AI 智能体录制工作演示视频

01:19 Simon Willison 博客精选 73 shot-scraper 1.10 新增 shot-scraper video 命令，支持通过 storyboard.yml 文件定义操作步骤，并利用 Playwright 录制浏览器视频。演示视频展示了 Datasette 中从粘贴的 CSV/TSV/JSON 数据创建新表的功能。该功能依赖 Playwright 1.61.0 新增的 screencast 机制，解决了此前视频开头白帧、宽度固定 800px 等问题。开发者 Simon Willison 强调，将 --help 输出设计得足够详细，可使编码 Agent 直接利用该命令生成演示视频。智能体 GitHub MCP/工具产品更新推荐理由： Simon 把 agent 的产出从文字推到了视频，这个 shot-scraper video 让 agent 自己生成 storyboard 并录屏，等于给自动化流程加了一双眼睛，开发者可以立刻用上这套 demo 生成方案。

智能体 GitHub MCP/工具产品更新

AI HOT · 2026-07-02 00:00

Claude Code 入门：智能体循环

01:28 Claude：Blog（网页）精选 72 Claude Code 团队将智能体循环定义为 agent 重复工作直到满足停止条件的过程，并划分出四种主要类型：turn-based 循环（用户提示触发，Claude 自行判断完成或需更多上下文）、goal-based 循环（通过 /goal 命令设定可验证完成标准与最大轮次）、time-based 循环（通过 /loop 按时间间隔重复执行，可用 /schedule 移至云端）、以及 proactive 循环（基于事件或计划自动运行，无人实时参与）。文章还介绍了如何编写 SKILL.md 文件将人工验证步骤编码，让 Claude 进行端到端自检，减少 turn-based 循环中的手动操作。智能体 Anthropic MCP/工具教程/实践推荐理由： Anthropic把agentic loops从模糊概念变成四种可复制的模式，附带SKILL.md和命令示例，Claude Code用户读完就能设计更自主的编码流程。

智能体 Anthropic MCP/工具教程/实践

AI HOT · 2026-07-02 00:00

Apple Creator Studio 更新：更智能、更快速、更互联

01:29 Apple：Newsroom（RSS）精选 66 Apple Creator Studio 推出多项 AI 增强更新。Final Cut Pro 新增 on-device AI 驱动的 Generate Captions（自动转录音频生成字幕）和 Edit Detection（自动检测剪辑点）。Mac 版加入 Auto Mask（自动识别皮肤、天空等主体）、增强的 Match Color 和 Advanced Trimming。支持将帧发送至 Pixelmator Pro 编辑，并在 Keynote、Pages、Numbers 中直接调用 Pixelmator Pro 修改图片。Logic Pro 新增 Grammy 制作人制作的 Producer Project 及 Chord ID 改进。订阅价 $12.99/月或 $129/年，新用户免费试用一个月，教育用户 $2.99/月。产品更新图像生成语音推荐理由： Final Cut Pro 的自动字幕和遮罩是实打实的工作流提升，Pixelmator Pro 的深度整合也让设计更顺畅，虽然没有颠覆性突破，但创意工作者今天就能用上。

产品更新图像生成语音

AI HOT · 2026-07-01 22:07

ADK Go 2.0 发布：构建可靠的多智能体应用，新增基于图的工作流引擎、人工参与循环与动态编排

01:17 Google Developers Blog（RSS）精选 67 Agent Development Kit (ADK) for Go 2.0 发布，引入了一类基于图的工作流引擎，用于组合复杂多智能体应用。新版本内置人工参与循环（HITL）编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。统一执行模型后，单智能体应用与复杂图均运行在同一运行时上，简化了遥测与状态持久化。智能体 Google 产品更新部署/工程推荐理由： Google 给 Go 生态补上了多智能体编排的关键一环，图工作流引擎和人机协同直接内置，比之前拼积木的方式可靠很多，做 Agent 的 Go 开发者值得跟进。

智能体 Google 产品更新部署/工程

AI HOT · 2026-07-01 20:46

OpenAI 发布 GeneBench-Pro：计算生物学研究级基准测试

01:03 OpenAI：官网动态（RSS · 排除企业/客户案例）精选 70 OpenAI 发布 GeneBench-Pro，用于评估 AI 智能体在计算生物学中处理模糊性和做出判断性分析的能力。该基准包含 129 个问题，覆盖统计遗传学、群体遗传学等 10 个领域 21 个子领域。每个问题提供真实混乱的数据集和实验背景，要求模型探索数据、选择分析路径并迭代实验。采用合成数据构建，已知完整因果结构。82 个问题已由外部领域专家审核确认其现实性。 OpenAI 推理论文/研究推荐理由： OpenAI 的新基准揭示了一个信号，GPT-5.6 在需要科学判断的模糊任务上进步神速，从不足 5% 到接近 30%，且单题成本仅几美元，这对 AI for Science 的落地想象空间影响不小。

OpenAI 推理论文/研究

AI HOT · 2026-07-01 18:00

Grant Sanderson 谈 AI 与数学的未来

00:42 Dwarkesh Patel：Podcast & Blog（RSS）精选 61 3Blue1Brown 创办人 Grant Sanderson 正在制作记录 AI 在数学领域进展的新项目。他在与 Dwarkesh Patel 的对谈中指出，AI 在 IMO 获金牌并不等于 AGI，只是又一个被攻克的基准。即使 AI 未来解决千禧年大奖难题，仍可能存在大量人类任务无法被自动化。对话还探讨了概念突破验证周期可长达一个世纪、Riemann 假设的 AI 证明能否被人类理解、AI 能否在已有文献间发现隐藏联系，以及现实经济任务难以套用强化学习环境等话题。大佬观点推理现象/趋势推荐理由：这次对谈没有停留在AI刷数学题的喜报上，而是追问了‘验证循环’和‘定义生成’两个终极难题。Grant Sanderson的视角让人重新思考AI的进展究竟缺什么，数学家未来的角色会是什么。

大佬观点推理现象/趋势

AI HOT · 2026-07-01 15:38

OpenAI Signals 数据揭示 ChatGPT 全球采用趋势

00:13 OpenAI：官网动态（RSS · 排除企业/客户案例）精选 62 OpenAI Signals 数据显示，用户注册六个月后日均消息量增加50%，尝试任务种类翻倍。自2023年7月以来，各大洲活跃用户均大幅增长，非洲和亚洲增速最快，低人类发展指数国家增长尤为显著。用户群体更加多元化，女性名字用户已占全球多数，巴西、哥伦比亚、波兰和纳米比亚等国女性用户显著多于男性。非英语用户占活跃用户半数以上，领先语言为西班牙语、葡萄牙语和阿拉伯语；乌兹别克语、哈萨克语和缅甸语用户占比增长百分比最大。 OpenAI 现象/趋势推荐理由： OpenAI 首次公开用户行为数据，显示使用深度和广度随时间增长、非洲与亚洲增速最快，对做全球化产品的同行是个重要信号。

OpenAI 现象/趋势