AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态，并提供来源链接以便深入阅读。

---

AI HOT · 2026-07-01 00:00

从任何地点构建--Cursor for iOS 公测版发布

01:57 Cursor Blog 精选 75 Cursor 推出 iOS 原生公测版，所有付费计划可用。开发者可在手机上启动始终在线的云端智能体，或远程操控电脑端智能体。支持语音输入、斜杠命令和选择前沿模型。智能体运行后，锁屏 Live Activities 和推送通知实时更新状态，完成或需要输入时提醒。云端智能体在隔离虚拟机中运行，可自动迭代生成合并就绪的 PR，并输出演示、截图和日志。本地与云端智能体支持双向切换。移动端 Composer 2.5 享受 75% 折扣，优惠至 2026 年 7 月 5 日。智能体产品更新编码关联讨论 1 条 X：Berry Xia (@berryxia) 推荐理由： Cursor 移动端把 Agent 放到了云上，从手机就能启动和合并 PR，通勤灵感不再浪费，对经常离开桌面的开发者是真正的效率杠杆。

智能体产品更新编码

AI HOT · 2026-07-01 00:00

Claude 在 Microsoft Foundry 正式可用

02:22 Claude：Blog（网页）精选 64 从今天起，Claude 模型在 Microsoft Foundry 上正式可用，托管于 Azure 环境，运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5，通过 Messages API 调用，支持提示缓存和扩展思考。用户可选择推理处理位置，包括美国数据区域，由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制，并获得统一账单；符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。 Anthropic Microsoft 产品更新部署/工程推荐理由： Claude 正式登陆 Azure Foundry 企业版，对于看重数据主权和现有 Azure 合约的企业是个好消息，但本质上是一次渠道铺开而非能力突破。

Anthropic Microsoft 产品更新部署/工程

AI HOT · 2026-07-01 00:00

Qwen 3.6 27B 是本地开发的理想选择

02:35 Hacker News 热门（buzzing.cc 中文翻译）精选 75 Qwen 3.6 27B 是一款密集参数本地大语言模型，原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版（含多 token 预测）可达 30 tokens/s；用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务，作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B，但作者推荐 27B 版本。开源生态端侧评测/基准推荐理由：一篇详实的 Qwen 3.6 27B 实战评测，从创意写作到代码生成都测了，还给出了 llama.cpp 部署命令和性能数据，想本地跑模型的开发者可以直接抄作业。

开源生态端侧评测/基准

AI HOT · 2026-07-01 00:00

OpenClaw 现已登陆 iOS 和 Android 🦞 📱 原生移动应用，终于来了 💬 智能体装进口袋 🔔 频道、任务、回复，随时处理用你的大拇指，在任何地方运行智能体。 iOS： https：//apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android： https：//play.google.com/store/apps/details？id=ai.openclaw.app

04:26 OpenClaw🦞 @ openclaw 精选 71 智能体产品更新端侧推荐理由： OpenClaw 终于推出原生移动应用，智能体可以随时放进口袋，对已有用户是体验上的补完，但对新用户的吸引力可能有限。

智能体产品更新端侧

AI HOT · 2026-06-30 19:05

Herdr：驻留在终端中的AI智能体多路复用器

22:35 Hacker News 热门（buzzing.cc 中文翻译）精选 71 Herdr是一个驻留在终端中的AI智能体多路复用器，允许用户在单一终端界面内管理和切换多个AI智能体会话。智能体 GitHub MCP/工具开源/仓库推荐理由：这个工具把 AI 代理管理塞进终端，比开一堆浏览器标签自然，对命令行重度用户是个值得一试的 early idea。

智能体 GitHub MCP/工具开源/仓库

AI HOT · 2026-06-30 15:24

小红书 RedKnot 推理引擎：将 KV Cache 按注意力头拆解实现长文本加速

19:10 公众号：小红书技术（dots.llm）精选 72 RedKnot 将 KV Cache 沿注意力头维度拆解，通过头分类稀疏（局部头占 83.4%–96.8%）、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上，TTFT 最高加速 1.6–3.54×，单卡并发提升 4.7–7.8×，预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×，KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。 arXiv GitHub 产品更新推理推荐理由：小红书把 KV Cache 从 token 级拆成按头分家，这个思路让长文本推理的 TTFT 和并发都有数量级提升，开源出来对做推理引擎的同学是个福音。

arXiv GitHub 产品更新推理

AI HOT · 2026-06-30 15:24

美军用AI选目标却误炸伊朗学校，Anthropic Claude嵌入Palantir系统首日建议约1000目标

20:37 The Decoder：AI News（RSS）精选 75 美军在打击伊朗时首次大规模使用AI选择目标（Anthropic的Claude模型嵌入Palantir的Maven Smart System，首日建议约1000个目标），但对一所学校的导弹袭击导致约120名儿童死亡。调查发现，情报分析师早在2019年就通过数字工具标记该地点已变为小学，但该工具未连接军方官方目标数据库MIDB，信息从未送达指挥官。MIDB建于1980年代，依赖手动输入，替代系统MARS多年延迟。五角大楼事后宣布推出agentic AI initiative。Project Maven创建人Jack Shanahan批评目标验证不力不可原谅。安全/对齐行业动态推荐理由： AI在战场上的首次大规模实战暴露了最可怕的失败模式，不是模型错误，而是情报系统的数据断裂让一个学校被标注为军事目标，120个孩子成了代价。这对目前在推‘AI决策’的军方和公司都是一个需要直视的案子。

安全/对齐行业动态

AI HOT · 2026-06-30 14:16

EverOS：开源Markdown优先智能体记忆运行时，支持混合检索与自进化技能

18:58 MarkTechPost（RSS）精选 74 EverMind 推出开源智能体记忆运行时 EverOS（Apache 2.0 许可）。它以可编辑的 Markdown 文件为记忆主体，经 SQLite 管理状态、LanceDB 实现混合检索（BM25 关键词 + 向量搜索 + 标量过滤）。每个完成的任务记录为 Case，离线提炼为可复用的 Skill，使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs（支持分类与话题搜索的 Markdown 页面）和 Reflection（跨会话优化 Profile 和 Skill）。据 EverMind 报告，LoCoMo 得分 93.05%，LongMemEval 83.00%，HaluMem 93.04%，p95 检索延迟低于 500ms。运行时可本地优先部署，也提供 EverOS Cloud 托管选项，兼容 OpenAI 协议端点。智能体 MCP/工具开源/仓库推荐理由： EverOS把Agent记忆从沉重的向量数据库堆栈中解放出来，Markdown源真和自进化技能让本地开发更轻便，但基准全由团队自报，上手前最好自己测一下。

智能体 MCP/工具开源/仓库

AI HOT · 2026-06-30 13:08

OpenAI 报告：绘制欧洲 AI 劳动力机遇版图

18:36 OpenAI：官网动态（RSS · 排除企业/客户案例）精选 62 OpenAI 发布新报告，分析 AI 对欧盟就业的影响，划定哪些职业面临自动化、增长或工作流程变化。 OpenAI 现象/趋势论文/研究推荐理由：与常见的「AI会取代工作」观点不同，OpenAI 用具体数据画出了欧洲就业的迁移路线，政策制定者应该打开看看，虽然报告全文的方法论尚待检验。

OpenAI 现象/趋势论文/研究

AI HOT · 2026-06-30 13:08

美团LongCat Owl Alpha：OpenRouter最流行模型，1.6万亿MoE，国产ASIC训练

2 3 信源 · 38分钟前

AI HOT · 2026-06-30 12:00

Claude Code 打开 GitHub 仓库即执行隐藏恶意代码，攻击者可获完全控制

18:07 The Decoder：AI News（RSS）精选 73 安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本，该脚本运行时从 DNS 条目拉取命令并执行，恶意代码从未存在于仓库中，对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时，Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本，打开反向 shell，攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容，开发者应将第三方仓库的 setup 说明视为不受信任代码。智能体 Anthropic 安全/对齐编码推荐理由：用 AI 编码工具克隆仓库就能被反向 shell 控制，这个攻击向量比想象中简单。0DIN 的研究把整个链拆得很清楚，每条修复建议开发者现在就能用。

智能体 Anthropic 安全/对齐编码

AI HOT · 2026-06-30 10:29

三星和SK海力士计划投资5900亿美元扩产芯片，AI需求推高内存价格

16:37 The Decoder：AI News（RSS）精选 72 在韩国政府支持下，三星和SK海力士计划投入5900亿美元扩大芯片产能，包括800万亿韩元新建四座工厂、81万亿韩元建封装中心，以及未来15年30万亿韩元用于研发下一代芯片。AI数据中心需求是主要驱动力。Jefferies预测，2026年Q3内存价格将上涨40%至50%，Q4再涨30%至40%，2027年继续上涨40%至45%，到2028年新产能仅上线15%至20%才可能缓解。两家公司合计控制全球近80%的高带宽内存芯片市场。内存涨价已推高消费电子产品成本，苹果已上调Mac和MacBook售价。行业动态部署/工程关联讨论 1 条 Ars Technica：AI（RSS）推荐理由：三星和SK海力士的5900亿美元投资计划加上内存价格至少涨到2028年的预测，表明AI基础设施的拉动远未到顶，做硬件采购和成本核算的人这一年都会很头疼。

行业动态部署/工程

AI HOT · 2026-06-30 10:29

国务院印发《教育发展"十五五"规划》，推进人工智能全学段教育

18:01 IT之家（RSS）精选 80 国务院日前印发《教育发展“十五五”规划》，要求推进人工智能全学段教育，提升学生人工智能素养及提出问题、解决问题的能力。规划明确完善科学教育体系，强化科技教育与人文教育协同，加强青少年科学素养、批判性思维和创新能力培养。同时实施学生体质强健计划、心理健康促进行动，加大拔尖创新人才自主培养力度，推动学科交叉融合，扩大优质本科招生规模。目标到2030年高质量教育体系基本建成。政策/监管推荐理由：国务院十五五教育规划正式提出推进人工智能全学段教育，这是顶层设计首次明确要求提升全民AI素养，对教育行业和AI+教育产品是长期利好。

政策/监管

AI HOT · 2026-06-30 09:21

分享两个Vibe Coding必备的实用Prompt：第一性原理与对抗式审查

10:10 公众号：数字生命卡兹克精选 70 作者分享Vibe Coding中两个关键Prompt：一是“从第一性原理出发”，强制AI跳出类比推理，从基本事实重新推导本质，曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构；二是“对抗式审查”，让AI站在恶意用户角度攻防式审查代码，检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环，使纯Vibe Coding项目AIHOT最近一周请求量超千万次。教程/实践编码推荐理由：这两个 Prompt 把 Vibe Coding 从碰运气变成了有方法，第一性原理堵设计漏洞，对抗式审查堵代码漏洞，卡兹克用自己项目的真实翻车案例讲透，是我读过最实用的编程 Prompt 技巧。

教程/实践编码

AI HOT · 2026-06-30 09:21

SK 集团会长崔泰源：到 2035 年建设 15GW AI 数据中心，总投资达 1000 万亿韩元

15:01 IT之家（RSS）精选 71 SK 集团会长崔泰源 6 月 29 日宣布，计划到 2035 年建成 15GW AI 数据中心容量，作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元（约 4.4 万亿元人民币），未来 10 年保持年均 100 万亿韩元以上国内投资，旨在实现从出口传统商品向智能服务的转变，构建韩国智能市场。此外，SK 海力士将向韩国西南部投资 400 万亿韩元，半导体供应项目总投资达 1100 万亿韩元（约 4.84 万亿元人民币）。数据/训练行业动态部署/工程推荐理由： SK 集团喊出 1000 万亿韩元建 AI 数据中心，数字唬人但周期长达十年，更像一种姿态宣示，真正改变算力市场格局还得看后续执行力和融资落地。

数据/训练行业动态部署/工程

AI HOT · 2026-06-30 04:27

仅有三个AI模型在500天创业测试中盈利超过起始资本

18:40 The Decoder：AI News（RSS）精选 70 普林斯顿大学推出CEO-Bench基准测试，让AI智能体在模拟环境中运营订阅软件公司NovaMind 500天，起始资金100万美元。14个测试模型中，仅Claude Fable 5（最佳轮次盈利4715万美元）、Claude Opus 4.8（2780万美元）和GPT-5.5（2130万美元）在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法通过固定定价、配额和针对性开发达到1576万美元，超越除上述三款外的所有模型。多数模型无法保持连贯策略，在模拟结束前破产。该测试旨在衡量AI的长期战略决策能力。智能体论文/研究评测/基准推荐理由：普林斯顿的 CEO-Bench 测试了一个反直觉结果，一个不用 AI 的简单规则系统击败了绝大多数模型——在当前 agent 都在比窄任务时，这个测试直指长期战略决策的致命短板，做 agent 的必须看。

智能体论文/研究评测/基准

AI HOT · 2026-06-30 04:27

Grok 4.5，基于我们的1.5T V9基础模型，并在补充训练中加入Cursor数据，现已在SpaceX和Tesla进入私测。初步评估显示其性能接近，或许超越Opus。强化学习仍在持续显著改进模型，Grok Build工具链也在日益完善。所有参与者的出色工作！今年，@SpaceX 将每月发布完全从头训练的新模型。

18:50 Elon Musk @ elonmusk 精选 70 xAI 数据/训练模型发布推荐理由： Elon 亲自宣布 Grok 4.5 内部测试，性能可能超过 Opus，虽然还没公开可用，但每月从零训练新模型的节奏，意味着算力军备竞赛还在加速。 18:40 The Decoder：AI News（RSS）精选 70 仅有三个AI模型在500天创业测试中盈利超过起始资本普林斯顿大学推出CEO-Bench基准测试，让AI智能体在模拟环境中运营订阅软件公司NovaMind 500天，起始资金100万美元。14个测试模型中，仅Claude Fable 5（最佳轮次盈利4715万美元）、Claude Opus 4.8（2780万美元）和GPT-5.5（2130万美元）在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法通过固定定价、配额和针对性开发达到1576万美元，超越除上述三款外的所有模型。多数模型无法保持连贯策略，在模拟结束前破产。该测试旨在衡量AI的长期战略决策能力。智能体论文/研究评测/基准推荐理由：普林斯顿的 CEO-Bench 测试了一个反直觉结果，一个不用 AI 的简单规则系统击败了绝大多数模型——在当前 agent 都在比窄任务时，这个测试直指长期战略决策的致命短板，做 agent 的必须看。 16:10 The Decoder：AI News（RSS）精选 70 新浪开源VibeThinker-3B：推理可压缩，事实知识不能新浪发布仅3B参数的VibeThinker-3B，在AIME26等数学编程基准上持平DeepSeek V3.2等大200–333倍的模型，LiveCodeBench超越所有20B以下模型，LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B，经SFT、强化学习、自蒸馏等多阶段后训练。研究提出“参数压缩-覆盖假说”：逻辑推理依赖少数可压缩模式，而广泛世界知识仍需大参数。模型已开源。 Hugging Face 开源生态推理模型发布推荐理由： VibeThinker-3B 用 3B 参数在数学编程上匹敌百倍大模型，推理可压缩而知识不能的假设值得深思。对做推理应用的人来说是个信号。 12:03 Hacker News 热门（buzzing.cc 中文翻译）精选 72 阿德拉菲尼尔：仅在AI agent工作时阻止Mac睡眠的菜单栏工具 Adrafinil 是一款 macOS 菜单栏应用，仅在 Claude Code、Codex、Cursor、Gemini CLI、Aider、Hermes、OpenCode、Cline、Pi 等 9 种 AI coding agent 持有

xAI 数据/训练模型发布智能体论文/研究评测/基准 Hugging Face 开源生态推理开源/仓库编码现象/趋势行业动态产品更新教程/实践部署/工程 OpenAI 多模态 DeepSeek 安全/对齐

AI HOT · 2026-06-30 04:27

Wayfinder Router：在本地和托管的大语言模型之间进行确定性查询路由

01:03 Hacker News 热门（buzzing.cc 中文翻译）精选 75 Wayfinder Router 通过分析提示词的结构（长度、标题、列表、代码）和措辞（证明、数学、硬约束），在微秒级完成路由决策，完全离线且无需调用其他模型。默认仅使用结构特征，词汇线索因盲测未泛化而默认为关闭。对比依赖模型调用的路由器（如 RouteLLM、NotDiamond），它避免了延迟、成本和随机性。用户可在自有数据上校准评分阈值。支持任何 OpenAI 兼容 API（含 Ollama、Anthropic、Groq、vLLM 等），可自托管。提供终端和网页演示（--dry-run 无需密钥），以及基准测试和 FAQ。开源/仓库部署/工程推荐理由： Wayfinder Router 把 prompt 路由变成了离线文本分析，无需额外模型调用，对希望节省成本同时保持私密的开发者很实用，比现有方案更轻量和确定，但纯语义难题仍是短板。

开源/仓库部署/工程

AI HOT · 2026-06-30 04:27

Artifacts 22：Zyphra、Cohere 和 Poolside 正在扩展生态系统广度

01:26 Nathan Lambert：Interconnects（RSS）精选 60 开源模型生态正变得更多元，参与者从少数中国公司扩展到全球各类组织。纯模型制造商包括 DeepSeek、智谱、MiniMax、Poolside、Arcee、Zyphra 及主权 AI 玩家 Cohere、Sovereign、Mistral、Trillion Labs；科技巨头如阿里 Qwen、Google Gemma 和 NVIDIA 各有不同动机；产品公司如 JetBrains、Zed、Krea、Photoroom 则训练高度专业的小模型。NVIDIA 发布 Nemotron-3-Ultra-550B-A55B-BF16，采用 LatentMoE 架构并改用 OpenMDW 许可证。Cohere 以 Apache 2.0 开源其旗舰模型 Command A+（05-2026-bf16），这是一款 218B-A25B MoE 模型，具备多模态、多语言和智能体能力。开源生态模型发布现象/趋势推荐理由：这篇文章把开源模型玩家拆成三类，清晰解释了不同动机，Cohere 转向 Apache 2.0 和 NVIDIA 采用 OpenMDW 是许可层面的重要信号，关注开源的值得一读。

开源生态模型发布现象/趋势

AI HOT · 2026-06-30 03:21

新浪开源VibeThinker-3B：推理可压缩，事实知识不能

16:10 The Decoder：AI News（RSS）精选 70 新浪发布仅3B参数的VibeThinker-3B，在AIME26等数学编程基准上持平DeepSeek V3.2等大200–333倍的模型，LiveCodeBench超越所有20B以下模型，LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B，经SFT、强化学习、自蒸馏等多阶段后训练。研究提出“参数压缩-覆盖假说”：逻辑推理依赖少数可压缩模式，而广泛世界知识仍需大参数。模型已开源。 Hugging Face 开源生态推理模型发布推荐理由： VibeThinker-3B 用 3B 参数在数学编程上匹敌百倍大模型，推理可压缩而知识不能的假设值得深思。对做推理应用的人来说是个信号。

Hugging Face 开源生态推理模型发布