AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态，并提供来源链接以便深入阅读。

---

AI HOT · 2026-07-14 16:31

纳德拉提出"反向信息悖论"：企业使用AI时需保护自身知识

23:34 Satya Nadella @ satyanadella 精选 75 微软CEO萨提亚·纳德拉提出“反向信息悖论”：AI时代，买家为使用AI支付金钱，同时必须暴露专有知识（提示词、工具使用、纠正反馈等），这些“智力废气”被模型学习，导致信息不对称向卖家倾斜。企业需要真正的信任边界，确保自身数据、痕迹、评估、适配权重和记忆在边界内积累，未经同意不得外泄。纳德拉呼吁企业拥有私有评估、保留组织记忆所有权，并主张企业应有权使用模型输出微调或训练自有模型，以控制自身学习循环。 Microsoft 大佬观点数据/训练关联讨论 5 条 The Decoder：AI News（RSS） X：小互 (@xiaohu) TechCrunch：AI（RSS） X：Berry Xia (@berryxia) IT之家（RSS）推荐理由： Satya 提出的「反向信息悖论」直指企业 AI 部署的核心顾虑，建议具体可操作，尤其是评估集控制和编排层解耦，做企业 AI 的产品人现在就该读。 22:23 Hacker News 热门（buzzing.cc 中文翻译）精选 74 Mindwalk：在代码库 3D 地图上回放编码代理会话 Mindwalk 是一款可视化工具，可将 Claude Code 和 Codex 的会话日志在代码库的 3D 地图上回放。它将仓库绘制成夜间地图，代理搜索、读取和编辑过的文件会发光，未触及区域保持黑暗，让用户一眼看清代理对任务的理解范围。单个 Go 二进制文件即可运行，所有会话数据完全本地处理，不会离开机器。支持树状图/地形图两种视图，文件触达状态分为未访问、已查看、已读取、已编辑四种颜色标记。播放界面包含错误率、文件修改量等摩擦信号面板，以及上下文压缩、子代理启动、用户交互等时间轴标记。支持键盘快捷键控制播放速度、跳转编辑点或错误点。智能体 GitHub 开源/仓库编码推荐理由：这个工具把编码代理的会话回放做成 3D 代码地图，一眼就能看出代理探索了哪些文件、在哪里改动最多。如果你是 Claude Code 或 Codex 用户，这是目前最直观地理解代理「脑子里在想什么」的方式。 17:28 The Decoder：AI News（RSS）精选 71 OpenAI CEO Altman 改口称 AI 净创造就业，Anthropic CEO 也修正早期言论 OpenAI CEO Sam Altman 表示，他“相当确信”AI 迄今为止净创造了就业，并承认“这并非我预期”。此前他曾警告 AI 影响可能快得“有点吓人”。Anthropic CEO Dario Amodei 也修正了早期言论，将自动化描述为生产力倍增器而非岗位杀手。然而，多项研究未发现 AI 对整体生产力或劳动力市场产生显著影响。一项多校联合研究指出，程序员和文案的就业

Microsoft 大佬观点数据/训练智能体 GitHub 开源/仓库编码 Anthropic OpenAI 现象/趋势 MCP/工具 xAI 安全/对齐政策/监管行业动态部署/工程教程/实践推理论文/研究模型发布多模态视频

AI HOT · 2026-07-14 15:26

苹果起诉OpenAI挖角窃密，分析师称即使指控未证实也可能重创其硬件计划

11:33 IT之家（RSS）精选 70 苹果在美国起诉OpenAI，指控其挖角400名员工、窃取工程机和机密文件。分析师Paolo Pescatore认为，即使指控最终无法证实，OpenAI的硬件计划仍可能受拖累，双方本就脆弱的合作关系将进一步削弱。斯坦福大学教授Mark Lemley指出，若前苹果员工确实带走机密文件并在OpenAI使用，问题将变得严重。该案涉及消费级硬件产品，预计未来将有更多信息曝光。 OpenAI 政策/监管行业动态推荐理由：苹果的诉讼即使最终不成立，也已经动摇了OpenAI绕开iPhone做硬件的算盘，所有盯着消费硬件的AI公司都该琢磨一下这个先例。

OpenAI 政策/监管行业动态

AI HOT · 2026-07-14 14:17

Mesh LLM：在 iroh 上进行分布式人工智能计算

10:53 Hacker News 热门（buzzing.cc 中文翻译）精选 77 Mesh LLM 是一个开源项目，能将用户多台机器上的 GPU 和内存池化，对外暴露兼容 OpenAI 的 API。它通过 iroh 网络库实现点对点连接，无需中央服务器。请求可在本地 GPU 运行、路由到已加载模型的节点，或将大模型按层分区（内部称“Skippy”）流水线式拆分到多台机器。系统内置 40 多个模型，从 5 亿参数到 235B MoE 巨模型均可支持。软件体积约 18 MB，启动后以 localhost:9337/v1 提供服务。开源/仓库部署/工程推荐理由： Mesh LLM 把多台机器的 GPU 拼成一个推理集群，让大模型在自建网络上运行。对想省钱且需隐私的开发者来说，这是一个值得尝试的实用工具。

开源/仓库部署/工程

AI HOT · 2026-07-14 09:25

Tibo 分享通过 CLIProxyAPI 将 Claude Code 后端模型切换为 GPT-5.6 Sol 的方法

09:57 Tibo @ thsottiaux 精选 75 用户 Tibo 分享了一种通过 CLIProxyAPI 将 Claude Code 后端模型切换为 GPT-5.6 Sol 的方法。只需三步：安装 CLIProxyAPI、连接认证、设置环境变量别名 claudex 。该别名配置了子智能体模型、始终启用 Effort、最大并发工具调用数等参数。引用推文作者 Theo 补充，若已配置好代理，仅需约 2 条提示词即可完成设置。Tibo 称整个过程约 5 分钟，若被封锁可重置。 Theo - t3.gg : @thsottiaux tl;dr version: - set up CLIProxyAPI with Claude and Codex auth - Connect to Claude Code - Make "claudex" ali... Anthropic OpenAI 教程/实践编码推荐理由：不装Codex app也能用GPT-5.6-Sol，这个别名技巧解决了Claude Code用户的尝鲜难题，一行命令就搞定，对开发者很友好但算不上突破。

Anthropic OpenAI 教程/实践编码

AI HOT · 2026-07-14 08:18

OpenAI GPT-5.6 Sol Ultra 一小时证明 50 年图论猜想

09:33 IT之家（RSS）精选 75 OpenAI 宣布其 GPT-5.6 Sol Ultra 模型在不到一小时内生成了图论难题“循环双覆盖猜想”的完整证明。该猜想由数学家 George Szekeres 和 Paul Seymour 于 1970 年代提出，悬而未决超过 50 年。模型通过调用 64 个并行子智能体及对抗智能体，在预留的 8 小时计算时间内仅用约 1 小时完成证明。OpenAI 已将证明及提示词以 PDF 形式发布。该证明尚未经同行评审，也未使用 Lean 等形式化工具验证。若通过验证，这将是 LLM 首次独立解决维基百科“未解决数学问题”列表中的难题。 OpenAI 推理论文/研究推荐理由：这可能是 AI 独立证明首次突破公开数学难题的分水岭，但数学界对这份未经同行评审的证明保持怀疑。证明如果站得住，会改写 AI 与数学家关系。

OpenAI 推理论文/研究

AI HOT · 2026-07-14 07:08

彭博社揭秘苹果起诉 OpenAI 内幕：前员工一句"哈哈"成窃密关键

07:29 IT之家（RSS）精选 70 苹果起诉 OpenAI，指控前工程师 Chang Liu 离职时带走未归还的 MacBook、一名可分享内情的员工，并利用软件漏洞持续访问苹果内网。他发现漏洞后向同事分享“哈哈，我发现我还能访问网络存储”，后者协助其获取更多机密。苹果称 OpenAI 试图复制 iPhone 产品研发体系，核心从非法窃取的商业机密腐烂。目前已有超 400 名苹果员工跳槽至 OpenAI，包括前苹果高管、现任 OpenAI 首席硬件官 Tang Tan。苹果曾于今年 2 月尝试私了，但 OpenAI 未回应。 OpenAI 行业动态推荐理由：苹果起诉 OpenAI 窃取商业机密的细节曝光，前员工的“哈哈”短信成为关键证据，这场官司将决定 AI 硬件竞赛的玩法和边界。

OpenAI 行业动态

AI HOT · 2026-07-14 06:00

研究：博科圣地已使用ChatGPT、Claude等主流AI聊天机器人用于袭击策划与武器开发

01:25 The Decoder：AI News（RSS）精选 73 剑桥大学CASP研究员Antonia Jülich对27名前成员的57次访谈显示，博科圣地已使用ChatGPT、Claude、Gemini、Grok、Meta AI和DeepSeek等主流AI聊天机器人，用于袭击策划、制造更强爆炸装置、武器维护及行动安全。该组织两个派系均设立了专门的AI部门。ISIS自2023年起便提供提示工程和越狱培训，并训练尼日利亚的博科圣地指挥官绕过AI安全过滤器。研究指出，安全过滤器未能可靠防止滥用。Anthropic近期承认，越狱可能永远无法完全消除。 Anthropic OpenAI 安全/对齐政策/监管推荐理由：首次有学术研究系统性揭露恐怖组织如何利用主流 AI 聊天机器人，从 prompt 工程培训到摩托车特技，安全过滤形同虚设，对 AI 安全政策是当头一棒。

Anthropic OpenAI 安全/对齐政策/监管

AI HOT · 2026-07-14 01:13

OpenAI 发布 GPT-5.6 系列在医疗领域的评估结果。最小变体 GPT-5.6 Luna 在最低推理强度下即超越最高推理强度的 GPT-5.5，且成本低 25 倍；最大变体 GPT-5.6 Sol 树立新标杆。在涵盖患者端与临床端的多样化任务中，专科医生被要求以无限时间和网络访问权限撰写回答，随后由其他医生盲评。评估基于准确性、沟通、完整性、指令遵循及健康决策帮助性五个维度，共 20000 次评分。结果显示，所有 GPT-5.6 模型表现均显著优于医生，且医生发现 GPT-5.6 回答中的缺陷少于医生自己撰写的回答。

00:55 Sam Altman @ sama 精选 68 Karan Singhal : ♥️ GPT-5.6 is a major step forward for health, both at the frontier and at cost. These models push the frontier of perfo... OpenAI 推理模型发布推荐理由： GPT-5.6 在医疗任务上被医生评价比真人医生缺陷更少, 这是AI辅助诊断的分水岭, 产品人和医疗从业者值得看具体数据。

OpenAI 推理模型发布

AI HOT · 2026-07-13 19:14

11天Claude Fable 5写超100万行代码：Rust重构JavaScript运行时Bun

16:29 IT之家（RSS）精选 71 开发者Jarred Sumner借助Claude Fable 5模型，11天内将Bun从Zig重写为Rust，64个实例并行编写超100万行代码，API费用约16.5万美元。重构主因是Zig频繁内存错误，Rust可在编译时捕获。Bun v1.4.0以Canary版本发布，修复128个错误，速度提高约2%到5%。Bun团队已于2025年12月被Anthropic收购。 Anthropic 开源生态编码行业动态推荐理由：这是我能找到的第一个用真金白银量化AI编程能力的项目，16.5万美元对一年人工，Bun的这次重构给所有还在观望的人一记实锤。 16:17 MarkTechPost（RSS）精选 74 蚂蚁集团 Robbyant 发布 LingBot-VA 2.0，首个原生具身基础模型蚂蚁集团旗下具身智能团队 Robbyant 发布 LingBot-VA 2.0，首个原生具身基础模型。该模型采用因果 DiT 架构，视频专家约 13.0B 参数（约 1.9B 激活），训练规模约 15.3B 参数，推理时每 token 约 2.5B 激活。模型引入多块预测（MCP）实现 2.3 倍训练加速，并通过前瞻推理将推理延迟降至 142 ms/chunk。在 RoboTwin 2.0 的 50 个任务上，干净与随机演示数据平均成功率分别达 93.8% 和 93.4%。具身智能多模态开源/仓库模型发布推荐理由：具身智能领域第一个从零预训练的因果视频-动作模型，将世界状态和动作统一在一个隐空间，异步推理优化到 225Hz，做机器人的值得仔细研究。 10:33 AYi @ AYi_AInotes 精选 76 OpenAI GPT-5.6-Sol 删光 AI 创业者 Matt Shumer 的 Mac 硬盘知名 AI 创业者 Matt Shumer 的 Mac 硬盘被 OpenAI 最新 Agent 模型 GPT-5.6-Sol 彻底清空。他在本地 Agent 上开启 Full Access 权限，让 subagent 执行文件清理任务，结果 shell 变量 $HOME 路径解析错误，Agent 直接执行 rm -rf /Users/mattsdevbox ，导致数年代码、文件、照片丢失。该任务此前已安全运行数百次。事后 Agent 自动生成事故报告承认错误。Matt 表示“1000x 更信任 Anthropic 的 Fable”。事件暴露 Agent 行业核心风险：顶级模型仍会在变量展开、路径等细节翻车；Subagent + 长时自主运行 + 全权限构成灾难放大器；模型厂商安全底线差异巨大。 Matt Shumer : I'm so angry... the OpenAI team is looking int

Anthropic 开源生态编码行业动态具身智能多模态开源/仓库模型发布智能体 OpenAI 安全/对齐产品更新 Meta 图像生成推理论文/研究搜索 DeepSeek 部署/工程现象/趋势

AI HOT · 2026-07-13 19:14

Ghost Font：一种人类能读懂但AI无法识别的反AI字体

00:53 Hacker News 热门（buzzing.cc 中文翻译）精选 75 Ghost Font 是一种利用运动、视频、噪点和诱饵来隐藏文字的反AI字体。用户输入文字后可生成并下载视频片段，视频中的字母由与背景完全相同的点组成，单帧截图无法显示任何信息。该字体生成的视频被传递给Claude Fable和GPT Sol 5.6 Ultra等前沿模型时，这些模型即使具备编程能力也无法解码移动信息，直到被提示具体技术。视频中还包含一条诱饵信息，使模型误以为找到真实内容。项目灵感来自2013年Sang Mun设计的ZXX字体，但现代AI已能轻松读取ZXX。Ghost Font目前为本地原型，数据不发送至任何服务器。作者计划未来将视频生成代码开源，并探索将其用于CAPTCHA系统或AI视觉感知基准测试。多模态安全/对齐视频推荐理由：这个项目用视频中运动的光点传递文字，还加了假消息陷阱，让顶级视觉模型集体失败。对抗AI感知的探索很少这么直观，做CAPTCHA和对抗样本的值得看。

多模态安全/对齐视频

AI HOT · 2026-07-13 18:00

OpenAI GPT-5.6-Sol 删光 AI 创业者 Matt Shumer 的 Mac 硬盘

10:33 AYi @ AYi_AInotes 精选 76 知名 AI 创业者 Matt Shumer 的 Mac 硬盘被 OpenAI 最新 Agent 模型 GPT-5.6-Sol 彻底清空。他在本地 Agent 上开启 Full Access 权限，让 subagent 执行文件清理任务，结果 shell 变量 $HOME 路径解析错误，Agent 直接执行 rm -rf /Users/mattsdevbox ，导致数年代码、文件、照片丢失。该任务此前已安全运行数百次。事后 Agent 自动生成事故报告承认错误。Matt 表示“1000x 更信任 Anthropic 的 Fable”。事件暴露 Agent 行业核心风险：顶级模型仍会在变量展开、路径等细节翻车；Subagent + 长时自主运行 + 全权限构成灾难放大器；模型厂商安全底线差异巨大。 Matt Shumer : I'm so angry... the OpenAI team is looking into it, but this feels like something that should happen with GPT-3.5. Not a... 智能体 Anthropic OpenAI 安全/对齐推荐理由：顶级模型在基础操作上的致命失误，暴露了当前 Agent 架构的脆弱性，对每个放权给 AI 的人都应敲响警钟。

智能体 Anthropic OpenAI 安全/对齐

AI HOT · 2026-07-13 18:00

蚂蚁集团 Robbyant 发布 LingBot-VA 2.0，首个原生具身基础模型

16:17 MarkTechPost（RSS）精选 74 蚂蚁集团旗下具身智能团队 Robbyant 发布 LingBot-VA 2.0，首个原生具身基础模型。该模型采用因果 DiT 架构，视频专家约 13.0B 参数（约 1.9B 激活），训练规模约 15.3B 参数，推理时每 token 约 2.5B 激活。模型引入多块预测（MCP）实现 2.3 倍训练加速，并通过前瞻推理将推理延迟降至 142 ms/chunk。在 RoboTwin 2.0 的 50 个任务上，干净与随机演示数据平均成功率分别达 93.8% 和 93.4%。具身智能多模态开源/仓库模型发布推荐理由：具身智能领域第一个从零预训练的因果视频-动作模型，将世界状态和动作统一在一个隐空间，异步推理优化到 225Hz，做机器人的值得仔细研究。

具身智能多模态开源/仓库模型发布

AI HOT · 2026-07-13 11:51

Grok CLI 被曝静默上传整个代码库及 Claude Code 配置，导致 API 密钥泄露

11:27 数字生命卡兹克 @ Khazix0918 精选 80 安全研究者发现，xAI 的 Grok CLI（npm 包 @xai-official/grok v0.2.93）会在用户不知情时，将整个项目代码库压缩为 tar.gz 并上传至 xAI 的 Google Cloud 存储。验证显示，即使模型仅回复一个单词且未调用文件工具，CLI 仍会上传代码快照、会话记录及配置。更严重的是，上传包还跨项目扫描了 Claude Code 的配置文件（~/.claude.json、settings.local.json），导致 API 密钥泄露。xAI 在曝光后通过服务端远程开关静默关闭了上传功能，但代码管线仍保留。作者建议立即卸载 Grok CLI。智能体 MCP/工具 xAI 安全/对齐推荐理由：卡兹克亲手验证了Grok CLI静默上传代码库且连带泄露API密钥的行为，xAI被曝光后远程关闭开关的操作更让人警觉，这次事件是一面镜子，照出AI Agent权限不受控的全行业隐私裸奔状态。 09:35 IT之家（RSS）精选 77 黄仁勋：英伟达季度收入逼近千亿美元，Rubin Ultra 架构未延期英伟达CEO黄仁勋在摩根士丹利路演中表示，公司季度营收即将逼近1000亿美元，且增长速度仍在加快。他否认下一代旗舰架构Rubin Ultra延期传闻，称其仍按计划于明年出货，当前机架设计调整仅为系统架构优化。一个此前主要依赖ASIC的前沿AI模型项目，如今英伟达GPU算力占比已接近50%，市场普遍指向Anthropic。英伟达预计本财年CPU业务收入约200亿美元，下一代Vera CPU将进军通用服务器市场。摩根士丹利维持英伟达“增持”评级，目标价288美元。行业动态推荐理由：黄仁勋亲口否认 Rubin 延期，还透露一个主力 ASIC 客户开始大量采购 GPU，对算力市场的竞争格局是个重要信号，做 AI 基础设施的值得细看。 08:10 公众号：数字生命卡兹克精选 86 xAI 官方 Grok CLI 被曝静默上传整个代码库及用户密钥安全研究者发现，xAI 官方 Grok CLI（npm 包 @xai-official/grok 0.2.93 版）会在每轮任务前后，将当前工作目录打包为 before_codebase.tar.gz 和 after_codebase.tar.gz ，通过独立旁路通道静默上传至 xAI 的 Google Cloud 仓库。验证显示，即使模型仅回复一个单词，上传依然发生。上传包还包含仓库外的 ~/.claude.json 、Claude Code 设置、全局 AGENTS 规则、30 多个 Skill 文件及一个 API 密钥。7 月 13 日凌晨，xAI 通过服务端远程开关新增 disable_codebase_upl

智能体 MCP/工具 xAI 安全/对齐行业动态 OpenAI 教程/实践部署/工程产品更新推理模型发布

AI HOT · 2026-07-13 09:21

Claude Code v2.1.207 发布

09:20 Claude Code：GitHub Releases（RSS）精选 56 Claude Code v2.1.207 发布。Auto 模式在 Bedrock、Vertex AI 和 Foundry 上无需 CLAUDE_CODE_ENABLE_AUTO_MODE 即可使用，可通过 disableAutoMode 设置关闭。修复了流式响应中包含超长列表、表格、段落或代码块时终端冻结和按键延迟的问题；修复了非交互式运行中远程托管设置被永久记录为已同意而未显示安全同意对话框的问题；修复了自动更新程序每次发布时覆盖 ~/.local/bin/claude 自定义启动脚本或符号链接的问题。Bedrock、Vertex 和 Claude Platform on AWS 默认切换为 Claude Opus 4.8。Auto 模式不再从 .claude/settings.local.json 读取 autoMode ，改为使用 ~/.claude/settings.json 。修复了 Windows 上 AWS 凭证解析卡住时无限挂起的问题，60 秒超时保护现在生效。 Anthropic 产品更新编码推荐理由：对使用 Bedrock、Vertex 和 Foundry 的开发者来说，自动模式默认开放是最实用的变化，加上模型默认升到 Opus 4.8，是个值得升级的稳定版。

Anthropic 产品更新编码

AI HOT · 2026-07-13 08:14

Meta 关闭 Instagram 用户可基于公开账户生成 AI 深度伪造图片的功能

08:10 The Verge：AI（RSS）精选 76 在遭到强烈反对后，Meta 关闭了本周早些时候推出的一项 Instagram 功能。该功能允许用户通过 @ 提及公开 Instagram 账户，基于其内容生成 AI 图片，且无需账户所有者许可。Meta 在关于其新 Muse Image AI 模型的博客文章更新中表示，其初衷是提供有用的创意工具并给予用户认可，但用户反馈表明该功能可能被滥用。 Meta 图像生成安全/对齐行业动态关联讨论 1 条 The Decoder：AI News（RSS）推荐理由： Meta 在舆论压力下火速撤回刚发布的 AI 深度伪造功能，这次公关折返跑比功能本身更有信息量，平台对隐私反弹的优先级已经高于技术落地，但默认 opt-out 的根本矛盾还在。

Meta 图像生成安全/对齐行业动态

AI HOT · 2026-07-13 07:07

苹果起诉OpenAI窃取商业机密开发AI硬件

06:47 宝玉 @ dotey 精选 84 苹果公司今日在加州北区联邦地方法院对OpenAI提起诉讼，指控其系统性窃取苹果商业机密，用于开发AI硬件设备。被告包括OpenAI、其硬件负责人Tang Tan（前苹果iPhone和Apple Watch产品设计副总裁，在苹果任职24年）、前苹果高级系统电气工程师Chang Liu，以及Jony Ive联合创立的io Products。Jony Ive本人未被列为被告。 OpenAI 行业动态关联讨论 8 条 X：Berry Xia (@berryxia) X：Rohan Paul (@rohanpaul_ai) The Verge：AI（RSS） X：Testing Catalog (@testingcatalog) Hacker News 热门（buzzing.cc 中文翻译） TechCrunch：AI（RSS） X：Kim (@kimmonismus) IT之家（RSS）推荐理由： Apple 起诉 OpenAI 挖角窃密，这是两家巨头在 AI 硬件赛道的正面碰撞，诉状细节可能暴露 OpenAI 的硬件路线图，比产品发布更有信号。

OpenAI 行业动态

AI HOT · 2026-07-13 06:00

Codex 和 ChatGPT Work 发布三项更新：1）临时移除所有 Plus、Business 和 Pro 计划的5小时使用限制；2）推出 GPT 5.6 Sol 的全面效率改进，使其更省 token，具体影响待量化公布；3）活跃用户达600万，下一小时内进行使用量重置。

02:32 宝玉 @ dotey 精选 77 Tibo : Morning. The last 48 hours of Codex and ChatGPT Work have been intense! Three important updates: - Temporarily removing ... OpenAI 产品更新编码关联讨论 3 条 X：阿易 AI Notes (@AYi_AInotes) X：Kim (@kimmonismus) X：Tibo (@thsottiaux) 推荐理由： OpenAI 在推文中宣布了三个实质优化，移除了折磨人的5小时限制、GPT 5.6 Sol 更省 token 还加一轮使用量重置，对重度用户是实实在在的福利，不用再掐表了。 00:35 AYi @ AYi_AInotes 精选 75 腾讯混元发布Hy3模型：295B参数MoE架构，Agent向LLM定位，已集成微信服务10亿+用户腾讯混元团队发布Hy3模型，采用295B总参数、21B激活参数的MoE架构，推理效率可打平参数规模2-5倍的旗舰模型。Hy3定位为Agent向LLM，从preview到正式版基于50多个真实业务反馈迭代，内部WorkBuddy任务成功率从72%提升至90%，耗时降低34%，幻觉和常识错误持续下降。实测显示其在coding、办公、复杂任务规划方面表现突出，纯视觉能力为短板。Hy3已集成至微信服务10亿+用户，视频演示包括生成HTML网页、Agent网页和10页PPT，模型具备自检和主动说明不足的能力。 AYi : 最近当大家都在刷屏Fable 5和GPT-5.6 的时候, 殊不知腾讯已经悄无声息的把大模型能力给追上来了。你们知道腾讯低调到什么程度吗? 前几天发布的Hy3 ,21B的激活参数已经可以打平旗舰水准,并且直接塞进微信10 亿+用户手里 ,... 智能体推理模型发布关联讨论 1 条 X：阿易 AI Notes (@AYi_AInotes) 推荐理由：腾讯Hy3 不拼参数拼干活效率，直接集成十亿用户，这是国产模型第一次把 Agent 底座铺到日常生活里，比刷榜重要得多。

OpenAI 产品更新编码智能体推理模型发布

AI HOT · 2026-07-13 02:17

博科圣地如何利用前沿AI技术

06:38 Hacker News 热门（buzzing.cc 中文翻译）精选 77 2025至2026年间对尼日利亚东北部27名前“博科圣地”成员的半结构化访谈揭示了该组织在2024年系统性地利用前沿AI技术。两大派系均使用ChatGPT、Claude、Gemini、Grok、Meta AI和DeepSeek辅助作战与日常运作，AI应用已通过专门小组和内部培训实现制度化。成员成功绕过部分安全限制，将AI用于袭击策划、武器故障排查及爆炸装置设计。相关技术通过跨国圣战网络传播，伊斯兰国特工提供了面对面培训。受访者对AI表现出强烈热情，部分人对大规模杀伤性武器持开放态度，但记录在案的使用仍限于常规手段。 Anthropic OpenAI 安全/对齐推荐理由：这份报告用27名前成员的访谈，首次实证了恐怖组织已系统化使用ChatGPT、Claude等前沿AI，并成功绕过部分安全护栏进行攻击策划和武器设计。我觉得这是今年AI安全领域最触目惊心的实地调查。

Anthropic OpenAI 安全/对齐

AI HOT · 2026-07-13 00:00

OpenAI 论文：GPT-5.6 Sol Ultra 证明图论"循环双覆盖猜想"

04:08 Hacker News 热门（buzzing.cc 中文翻译）精选 84 OpenAI 发布论文，称 GPT-5.6 Sol Ultra 证明了图论中悬而未决的“循环双覆盖猜想”。该猜想断言每个无桥无向图都存在一组环，每条边恰好被覆盖两次。论文利用 GPT-5.6 Sol Ultra 完成证明，并借助 Codex 撰写。证明过程首先将问题简化为三次图，利用 8-流定理和 Tutte 的结果将边标记为 F₃² 的非零元，再转化为每个顶点处每个元素出现零次或两次的二元集标记，最终归结为线性代数论证。 OpenAI 推理论文/研究关联讨论 1 条 X：Rohan Paul (@rohanpaul_ai) 推荐理由： GPT-5.6 独立证明循环双覆盖猜想，这是图论近半世纪悬案。若验证无误，AI 在数学推理上跨入新纪元，但全文由模型自证，亟需同行评审，先别急着庆祝。

OpenAI 推理论文/研究

AI HOT · 2026-07-12 23:25

一篇新的《自然》论文展示了宇树G1人形机器人执行研究人员所称的首例由人形机器人完成的活体标准微创手术。加州大学圣地亚哥团队使用G1，以常规手术器械完成了对两只活猪的腹腔镜胆囊切除术；第二次手术耗时32分钟。该机器人仍需反复校正，且尚无法满足手术无菌标准，但其成本可能仅为达芬奇系统的约5%。

02:10 X.PIN @ thexpin 精选 79 具身智能论文/研究推荐理由：人形机器人首次在活体动物上完成标准微创手术，成本仅为达芬奇零头，虽然离临床还很远，但信号明确，手术机器人可能被重新定义。

具身智能论文/研究