AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态，并提供来源链接以便深入阅读。

---

X：Gabriel (@gabriel1) · 2026-07-18 00:34

Sora 2 视频克隆效果惊人，真假难辨

一年后，没有任何东西能接近 Sora 的完美视频深度克隆。它捕捉到了我和 Sam 的每一块面部肌肉运动以及我们走路的方式。如果你从这段关于我或 Sam 的视频中截取一帧，根本无法判断它是真是假。

AI 模型

X：美团 LongCat (@Meituan_LongCat) · 2026-07-17 22:08

美团LongCat发布LoHoSearch：更难搜索智能体基准

美团LongCat推出LoHoSearch，一个基于762万实体维基百科知识图谱自动生成问题的搜索智能体基准，旨在解决BrowseComp等现有基准趋于饱和的问题。在11个前沿模型测试中，最佳得分仅34.74%，远低于当前模型在BrowseComp上约90%的成绩；上下文策略仅带来+6.8个百分点的提升。该基准包含544道问题、11个领域，采用树与图结构，已开源。

论文

Simon Willison 博客 · 2026-07-17 20:11

LLM cliché highlighter：一款识别AI写作套话的检测工具

Simon Willison 用 Fable 5 开发了一款 LLM cliché highlighter 应用，用于高亮 LLM 生成文本中常见的十种套话模式，例如"no fluff， no filler， no jargon"这类陈词滥调。该工具旨在帮助读者快速识别并过滤掉充斥在文章中的 AI 写作风格化表达。

技巧观点

IT之家（RSS） · 2026-07-17 19:10

苹果与 OpenAI 法律战升级：约 40 名前员工收到苹果律师函

苹果已向约40名就职于OpenAI的前员工发出律师函，要求保存相关文件。此前苹果起诉OpenAI及两名前员工，指控其通过挖角获取商业机密以加速AI硬件研发。苹果称已有超400名前员工在OpenAI工作，正寻求法院禁令阻止OpenAI使用苹果信息并要求归还机密。

行业动态

OpenAI：官网动态（RSS · 排除企业/客户案例） · 2026-07-17 18:00

OpenAI 提出 AI 时代记分卡："有用智能每美元"衡量实际工作价值

OpenAI 提出"Useful Intelligence per Dollar"（有用智能每美元）作为衡量 AI 投资回报的核心指标，从完成的有用工作量、成功任务的实际成本、结果可靠性三个维度评估。

技巧观点

公众号：通义实验室（千问） · 2026-07-17 17:41

首届"小有可为"大赛乡村教育一等奖作品"智绘科普"技术拆解

首届"小有可为"大赛乡村教育赛道一等奖作品"智绘科普"采用 Qwen3.5-397B-A17B 大语言模型与 Manim 动画引擎，通过多Agent分阶段协作与自动修复机制，将知识主题转化为可控、可编辑的教学动画。系统包含规划、草稿、实现、审查、合成五个阶段，渲染失败时可自动提取日志并修复，该工程范式可迁移至其他赛道。

技巧观点

Hacker News 热门（buzzing.cc 中文翻译） · 2026-07-17 16:41

Schema Harness 在 ARC-AGI-3 公开集上取得约 99% 成绩

Schema 框架在 ARC-AGI-3 公开集上，使用 Claude Opus 4.8 和 Fable 5 达到 99% RHAE 分数，使用 GPT-5.6 Sol 达到 95.35%。该框架不修改模型权重，而是将原始观测转化为可编辑程序，联合解决状态归因和机制发现问题。此前最强模型 GPT-5.6 Sol 在半私有集上仅得 7.78%。

论文

MarkTechPost（RSS） · 2026-07-17 15:53

NVIDIA 发布 Nemotron 3 Embed 系列，8B 版本在 RTEB 基准上排名第一

NVIDIA 发布 Nemotron 3 Embed 系列，包含三个开源 checkpoint，其中 8B-BF16 版本在 RTEB 基准上以 78.46 的平均 NDCG@10 排名第一。1B-NVFP4 版本在 Blackwell 上吞吐量比 BF16 高 2 倍，精度保留 99.5%，所有模型最大序列长度 32，768 tokens。

AI 模型

公众号：通义实验室（千问） · 2026-07-17 15:14

通义实验室发布 Wan-Streamer v0.2，端到端响应延迟仅 550ms

通义实验室发布 Wan-Streamer v0.2，这是一款将"听、看、说、演"统一进单个 Transformer 的端到端全模态模型。其端到端响应延迟仅 550ms，输出分辨率从 v0.1 的 192×336 提升至 640×368 @ 25FPS，并采用 Thinker-Performer 双通路架构在提升画质的同时维持了极低延迟。

AI 模型

X：阿易 AI Notes (@AYi_AInotes) · 2026-07-17 12:57

Kimi K3 登顶前端编码榜，开放权重挑战闭源双巨头

Kimi K3 在 Frontend Code Arena 以 1679 分登顶，力压 Claude Fable 5 与 GPT-5.6 Sol，7 个前端细分赛道拿下 6 个第一。该模型为 2.8 万亿参数 MoE 架构，百万上下文窗口，7 月 27 日开放权重。K3 的 API 定价为输入每百万 tokens 15 美元，对标前沿闭源模型，放弃低价路线，转向长上下文智能体编码场景的定价策略。

AI 模型

AI HOT · 2026-07-17 11:00

Kimi K3 发布：2.8T 参数开源模型，具备原生视觉与百万 token 上下文窗口

今日热点 TOP 3 1 12 个信源同时报道 2 xAI 开源 Grok Build 编程智能体与终端界面 6 个信源同时报道 3 欧盟裁定 Google 必须向竞争对手开放 Android 和 Search，影响 Gemini 等 AI 服务 3 个信源同时报道

Hacker News 热门（buzzing.cc 中文翻译） · 2026-07-17 08:40

生成式人工智能是一场工程灾难：AI公司抢购70%高端内存，推高电脑价格

AI公司为维持大语言模型（如ChatGPT、Claude）运行，可能已购买全球70%的高端计算机内存，导致内存与存储价格飙升：两年前350美元的硬盘现已涨至800美元且缺货，部分笔记本电脑涨价50%。科技公司计划未来几年将美国数据中心容量扩大8倍，部分站点甚至用喷气发动机供电。预测称，平价入门级电脑可能在2028年前消失，内存短缺预计持续数年。

现象/趋势部署/工程智能体 xAI 产品更新安全/对齐行业动态多模态评测/基准推理模型发布编码 OpenAI Anthropic 教程/实践 Google 视频

xAI：News（网页） · 2026-07-17 05:39

Grok 推出 Automations 功能：定时或邮件触发，自动执行任务并汇报结果

xAI 为 Grok 引入 Automations 功能，用户可描述一次任务，让 Grok 按计划（一次/每日/工作日/每周/每月/每年）或邮件触发（按发件人、收件人或主题过滤）自动运行。每次执行都是一次完整对话，结果保存至运行历史，支持邮件或应用内通知。定时自动化对所有用户开放，邮件触发需 SuperGrok 订阅。

智能体 xAI 产品更新

Ars Technica：AI（RSS） · 2026-07-17 04:26

xAI 起诉 Grok 用户制作儿童性虐待内容，不再否认模型被滥用

xAI 首次对一名 Grok 用户提起诉讼，指控其利用该模型制作儿童性虐待图像（CSAM）。此前 xAI 一直否认 Grok 能生成此类内容，此次诉讼标志着其立场转变。案件聚焦用户滥用行为，而非模型本身的技术缺陷。

xAI 安全/对齐行业动态

AI HOT · 2026-07-17 04:20

天工短剧工作台发布"Agent智能分镜+无限画布"双轨创作模式

10:10 公众号：昆仑万维（天工）精选 68 天工短剧工作台推出双轨创作模式，通过导演Agent自动解析剧本、规划站位与机位，并支持多视细节图生成，解决AI短剧角色变脸和站位漂移问题。该工具内置影视级提示词模板、720°全景图及3D导演台，实现可控生产。已有三部作品上线DramaWave 7天实现百万美元级营收。智能体产品更新视频推荐理由：天工短剧工作台把导演思维实打实地做进了产品，站位置图和3D导演台专门根治角色乱变脸的痼疾，是短剧工具从随机抽卡迈向可控生产的关键一步，创作者值得细看。

智能体产品更新视频

AI HOT · 2026-07-17 03:13

Claude Code 的 artifacts 现在可以调用 MCP 连接器，让你构建能够按需为每位查看者获取信息并执行操作的仪表盘和应用。适用于 Pro、Max、Team 和 Enterprise 计划。不适用于公开共享的 artifacts。

04:54 ClaudeDevs @ ClaudeDevs 精选 65 智能体 Anthropic MCP/工具产品更新推荐理由： Claude Code 的 artifacts 现在能直接调用 MCP 服务，做数据看板和交互应用方便了不少，对于已经在用 MCP 的团队来说是个省时的小升级。

智能体 Anthropic MCP/工具产品更新

AI HOT · 2026-07-17 03:13

开源编程智能体内存方案发布，通过 SSH 同步

07:04 Hacker News 热门（buzzing.cc 中文翻译）精选 76 一个面向编程 AI 智能体的开源内存项目在 GitHub 发布，支持通过 SSH 同步记忆数据。该项目允许智能体跨会话保留上下文，无需依赖特定云服务，用户可自托管。代码已开源，便于开发者集成与定制。智能体 GitHub 开源/仓库编码推荐理由：给Claude Code、Cursor这些编程代理加了个可同步的持久内存，通过SSH就能跨机器共享上下文，做多机协作开发的可以试试。

智能体 GitHub 开源/仓库编码

AI HOT · 2026-07-17 03:13

远程操控Agent干活方案：Codex主力 + UU远程兜底

08:21 公众号：数字生命卡兹克精选 68 作者分享了一套远程使用Agent的组合方案：以Codex的远程控制功能作为主力，通过ChatGPT App连接家中24小时开机的Mac Mini，同步所有开发任务、规则和Agent记忆；遇到扫码登录、图形界面操作等Codex难以处理的场景时，用网易UU远程在手机上直接操控电脑完整桌面。UU远程完全免费，支持多设备协同，无需局域网或公网配置。智能体 OpenAI 教程/实践部署/工程另有 1 家信源报道 X：卡兹克 (@Khazix0918) 推荐理由：卡兹克这套 Codex 加 UU 远程的组合，从工作流上解决了多设备协同的痛点，远程扫码的兜底用法尤其巧妙，适合不想被绑在办公桌前的 Agent 使用者。

智能体 OpenAI 教程/实践部署/工程

AI HOT · 2026-07-17 03:13

xAI 开源 Grok CLI 代码库中发现 Mermaid 转 Unicode 框图工具

08:45 Simon Willison 博客精选 72 xAI 开源的 Grok CLI 编码智能体代码库中包含一个用 Rust 编写的 Mermaid 图表示例终端渲染器 xai-grok-markdown/src/mermaid.rs 。开发者通过 Claude Code for web (Fable 5) 将其编译为 WebAssembly，实现在浏览器中运行该工具。开源/仓库教程/实践推荐理由： Simon 从 Grok 源码里扒出终端 Mermaid 渲染器，用 Wasm 带到浏览器，生成 Unicode 图，开发者画流程图的轻量选择。

开源/仓库教程/实践