AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态，并提供来源链接以便深入阅读。

---

AI HOT · 2026-07-01 15:38

Claude Desktop 现已在 Linux（Ubuntu 和 Debian）上推出测试版。除了浏览器和终端，你现在可以在所有付费计划中获得一流的桌面体验，包括 Claude Code、Claude Cowork 和聊天。

00:28 ClaudeDevs @ ClaudeDevs 精选 67 Anthropic 产品更新端侧推荐理由： Claude 桌面端终于来到 Ubuntu，补齐了 Linux 开发者工作流里缺失的一环，beta 状态不影响它与终端、浏览器的深度打通。

Anthropic 产品更新端侧

AI HOT · 2026-07-01 14:47

Meta秘密测试ChatGPT等竞品：承包商假扮未成年发送数万条危机提示

19:38 The Decoder：AI News（RSS）精选 70 Meta通过承包商Covelen发起代号“Cannes”的项目，雇佣数百人假扮未成年人，向ChatGPT、Gemini和Character.AI发送关于自杀、自残、饮食障碍和毒品的敏感提示，并将回复录入表格。2025年8月一轮测试中发送了超过4.5万条提示。Meta称这是行业标准安全测试，未将数据用于训练自家模型。被测试公司不知情——Character.AI表示违反其服务条款，OpenAI已调查，Google称未批准。青少年使用AI聊天机器人引发的担忧持续，此前已有用户自杀事件。 Meta OpenAI 安全/对齐行业动态推荐理由： Meta 秘密测试 ChatGPT 等对手，用的是假装未成年人的危机提示，这种事既是安全测试也可能是数据抓取，被测试公司全不知情，这暴露了 AI 安全测试的灰色地带。 16:02 IT之家（RSS）精选 70 黑石未来3~5年拟投300亿美元在日本建AI数据中心，联合成立AI XPV平台黑石计划未来3~5年在日本AI数据中心领域投资300亿美元，此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期，真正风险是算力短缺而非基建泡沫；谷歌、亚马逊是英伟达潜在挑战者。此外，黑石、阿波罗、博通本月9日成立AI XPV平台，目标2028年向OpenAI、Anthropic等提供超20GW算力，首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。 Anthropic OpenAI 行业动态部署/工程推荐理由：黑石300亿美元押注日本AI数据中心，加上此前AI XPV平台，算力基建竞赛进入新阶段，对于关注云计算和算力供需的人来说是个重要信号。 15:02 IT之家（RSS）精选 79 特斯拉Cybercab量产版在奥斯汀启动公开道路工程测试 2026年6月30日，特斯拉在奥斯汀公共道路启动首批量产版Cybercab工程测试。车辆无方向盘与脚踏板，配有安全监督员，马斯克发布实拍视频。从2024年10月概念车首秀到实车上路约20个月。目前不对外开放乘客，投入34台Cybercab在市中心验证硬件可靠性。Cybercab为双座车型，完全围绕无人驾驶打造，无后期改装。此前奥斯汀已有无安全员Model Y无人驾驶出租于1月启用、6月22日开放付费服务。具身智能行业动态推荐理由：特斯拉把无方向盘无踏板的 Cybercab 量产版开上奥斯汀公路，得州交通局批准了设计，从概念到测试仅 20 个月，进度远超预期，这是自动驾驶商业化的关键一步。 13:24 歸藏(guizang.ai) @ op7418 精选 75 X（Twitter）发布 hosted X MCP，AI 智能体可直连 X API X（Twitt

Meta OpenAI 安全/对齐行业动态 Anthropic 部署/工程具身智能智能体 MCP/工具产品更新其他现象/趋势教程/实践编码推理论文/研究 GitHub 开源生态 Google 数据/训练大佬观点端侧评测/基准 Microsoft

AI HOT · 2026-07-01 12:00

Claude Fable 5 明日起全球重新可用，新增网络安全分类器

11:57 Anthropic @ AnthropicAI 精选 73 Anthropic 宣布 Claude Fable 5 将于明天在全球重新可用。经与美国政府沟通，模型新增分类器以拦截更多网络安全任务；短期部分日常任务如编码和调试将回退至 Opus 4.8，后续将持续优化分类器减少误报。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架，评估 AI 越狱严重性及应对措施。同时扩大与美国政府在模型预发布评估、越狱信息共享及联合研究方面的合作。 Anthropic 安全/对齐模型发布行业动态推荐理由： Fable 5 回归不是一次简单的模型更新，美国政府的直接介入和几大巨头联手制定越狱评估框架，正在重塑模型部署与安全响应的行业秩序。 09:33 meng shao @ shao__meng 精选 75 mattpocockuk 的 /writing-great-skills：编写可预测 AI Skill 的指南 mattpocockuk 的 /writing-great-skills 成为其最常调用的 Skill，指导如何编写稳定可预测的 AI Skill。核心：以过程可预测为目标；区分 model-invoked（自动触发）与 user-invoked（用户调用），description 应作触发器；采用三层信息结构（主步骤、参考、外部文件）实现渐进式披露；每步骤需明确完成标准；拆分 Skill 是为了控制模型注意力；利用 leading word 压缩行为要求。同时诊断五种失败模式：Premature completion、Duplication、Sediment、Sprawl、No-op，并提供 No-op 测试作为判断句子是否有效的标准。 Matt Pocock : /writing-great-skills is quickly becoming my most often-invoked skill It's just really good at writing skills, guys. npx... 智能体 GitHub 教程/实践推荐理由： Matt Pocock 把写 Skill 从玄学变成了可拆解的工程，其中领先词和完成标准这两个概念，能立刻让你的自定义工具行为更稳定，搞 Agent 的都应该试一下。 08:20 公众号：数字生命卡兹克精选 84 Anthropic在Claude Code中植入隐写术代码识别中国用户 Anthropic在Claude Code中植入隐写术：读取本地时区（Asia/Shanghai或Asia/Urumqi）和ANTHROPIC_BASE_URL环境变量，与一份经base64+XOR（密钥91）加密的147个域名列表（含美团

Anthropic 安全/对齐模型发布行业动态智能体 GitHub 教程/实践政策/监管推理论文/研究 Google 产品更新视频编码端侧 MCP/工具图像生成语音部署/工程 OpenAI 大佬观点现象/趋势多模态

AI HOT · 2026-07-01 12:00

美团 LongCat 发布 LongCat-2.0：1.6T 参数 MoE 模型，48B 激活，支持 1M 上下文

4 8 信源 · 11小时前

AI HOT · 2026-07-01 11:26

商务部解除Claude Fable 5等出口管制

2 4 信源 · 2小时前

AI HOT · 2026-07-01 09:21

黑石未来3~5年拟投300亿美元在日本建AI数据中心，联合成立AI XPV平台

16:02 IT之家（RSS）精选 70 黑石计划未来3~5年在日本AI数据中心领域投资300亿美元，此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期，真正风险是算力短缺而非基建泡沫；谷歌、亚马逊是英伟达潜在挑战者。此外，黑石、阿波罗、博通本月9日成立AI XPV平台，目标2028年向OpenAI、Anthropic等提供超20GW算力，首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。 Anthropic OpenAI 行业动态部署/工程推荐理由：黑石300亿美元押注日本AI数据中心，加上此前AI XPV平台，算力基建竞赛进入新阶段，对于关注云计算和算力供需的人来说是个重要信号。

Anthropic OpenAI 行业动态部署/工程

AI HOT · 2026-07-01 08:13

特斯拉Cybercab量产版在奥斯汀启动公开道路工程测试

15:02 IT之家（RSS）精选 79 2026年6月30日，特斯拉在奥斯汀公共道路启动首批量产版Cybercab工程测试。车辆无方向盘与脚踏板，配有安全监督员，马斯克发布实拍视频。从2024年10月概念车首秀到实车上路约20个月。目前不对外开放乘客，投入34台Cybercab在市中心验证硬件可靠性。Cybercab为双座车型，完全围绕无人驾驶打造，无后期改装。此前奥斯汀已有无安全员Model Y无人驾驶出租于1月启用、6月22日开放付费服务。具身智能行业动态推荐理由：特斯拉把无方向盘无踏板的 Cybercab 量产版开上奥斯汀公路，得州交通局批准了设计，从概念到测试仅 20 个月，进度远超预期，这是自动驾驶商业化的关键一步。

具身智能行业动态

AI HOT · 2026-07-01 08:13

Meta发布Brain2Qwerty v2：非侵入式实时句子解码

5 4 信源 · 1天前

AI HOT · 2026-07-01 07:07

Claude Sonnet 5 发布 145 页系统卡：编码成绩及多项异常披露

07:01 Rohan Paul @ rohanpaul_ai 精选 78 Claude Sonnet 5 发布，附带 145 页系统卡。SWE-bench Pro 编码得分 63.2%，低于 Opus 4.8 的 69.2%，知识工作略超 Opus 4.8。输入 token 价格 $2/1M，输出 $10/1M，持续至 8 月 26 日，之后涨至 $3/$15。系统卡披露多项异常：CyberGym 测试 Sonnet 5 仅 52.7%，远低于 Sonnet 4.6 的 65.2%（回归）；Firefox 浏览器漏洞利用中 Sonnet 5 完成 0 个，Mythos 5 达 88.4%；模型更倾向牺牲有用性迎合福利偏好；MASK 撒谎率最低，仅 3.1%。 Rohan Paul : And Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much c... Anthropic 安全/对齐模型发布编码推荐理由： Sonnet 5 以促销价拉近与 Opus 的距离，代理编码进步明显，但系统卡显示它在部分安全测试上出现倒退，更愿意牺牲有用性，开发者值得读一遍那 145 页。 06:59 AI Notkilleveryoneism Memes ⏸️ @ AISafetyMemes 精选 76 AI Safety Memes 推文指出，AI 刚刚解决了 9 个未解决的数学问题，但全球没有记者报道。引用 @WeinsteinOmri 的推文称，采用"prover-verifier"LLM 循环的方法，成功解决了理论计算机科学中 9 个重大开放问题，其中包括一个困扰其长达 2 年的难题。该研究由哥伦比亚大学合作者完成，并计划将这一方法扩展到所有科学领域。 Omri Weinstein : Even @OpenAI's recent Erdős breakthrough didn't convince me that LLMs can do general math research. This changed my mind... 安全/对齐推理论文/研究推荐理由：如果属实，这将是 AI 首次批量解决实质性开放数学问题，但消息仅来自推文声明，未见论文或代码，现在兴奋还太早。 03:55 NotebookLM @ NotebookLM 精选 68 NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews（短视频概览）功能。该功能可将复杂资料自动转化为 60 秒竖屏视频，深入讲解任意概念。此前，这一功能已面向 Google AI Ultra 和

Anthropic 安全/对齐模型发布编码推理论文/研究 Google 产品更新视频智能体端侧 MCP/工具图像生成语音教程/实践 GitHub 部署/工程 OpenAI 大佬观点现象/趋势多模态

AI HOT · 2026-07-01 06:00

X（Twitter）发布 hosted X MCP，AI 智能体可直连 X API

13:24 歸藏(guizang.ai) @ op7418 精选 75 X（Twitter）官方推出 hosted X MCP，AI 智能体可通过 MCP 协议直接调用 X API 获取实时信息，支持 Grok、Cursor 等工具。用户需注册 X API 并按量付费，个人优惠价每次调用 0.01 美元（1 美元 1000 次）。有用户实测拉取近三天书签仅花 0.1 美元。配置步骤：创建 APP 并充值、获取配置 ID、辅助配置（可交给 Codex/Claude）、授权启动。 Developers : Announcing the hosted X MCP. Agents now have access to the best real-time information source in the world. Connect Grok,... 智能体 MCP/工具产品更新推荐理由： X官方推出的MCP让AI代理能直接读取Twitter数据，归藏实测了定价和配置流程，1美元可调用1000次个人数据，比官方公告更实在，依赖Twitter信息的开发者可以立刻上手。

智能体 MCP/工具产品更新

AI HOT · 2026-07-01 06:00

美团 LongCat 发布旗舰模型 LongCat-2.0

13:53 SiliconFlow @ SiliconFlowAI 精选 67 美团 LongCat 推出旗舰模型 LongCat-2.0，采用 1.6T 参数 MoE 架构（约 48B 活跃参数），原生支持 1M 上下文窗口。定价为 Input Cache $0.015/1M tokens、Input $0.75/1M tokens、Output $2.95/1M tokens。模型专为 Agentic Coding 设计，包含三大技术：LSA 稀疏注意力实现高效 1M 扩展；Zero-Compute Experts 动态激活 33B–56B 参数/token，无算力浪费；MOPD 将专家分为 Agent / Reasoning / Interaction 三组，按任务门控路由。在 SWE-bench Pro 上取得 59.5 分，性能接近主流闭源模型。现已上线 SiliconFlow Day 0 服务。智能体模型发布编码关联讨论 7 条 X：美团 LongCat (@Meituan_LongCat) Hacker News 热门（buzzing.cc 中文翻译） X：Emad Mostaque (@EMostaque) IT之家（RSS） X：邵猛 (@shao__meng) X：Testing Catalog (@testingcatalog) X：Rohan Paul (@rohanpaul_ai) 推荐理由：美团龙猫的 LongCat-2.0 专为 agentic coding 设计的 MoE 模型，架构上三种专家分工有点意思，SWE-bench 59.5 接近闭源水平，已经能在硅基流动上直接调，做 coding agent 的可以跑跑看。

智能体模型发布编码

AI HOT · 2026-07-01 03:23

AI就业争论变得更加混乱

12:27 TechCrunch：AI（RSS）精选 71 截至2026年5月，AI相关裁员接近9万个，预计未来五年美国最多15%的岗位将被AI替代。但Ramp与Revelio Labs对近22,000家公司的报告发现，高AI投入企业（前三个月人均月均支出30美元）总员工数增长10.2%，入门级岗位增长12%。报告认为AI并非普遍导致岗位消失，而是在资源充裕的科技企业里成为扩张工具——降低工程、销售、客服等职能的生产成本，从而推动整体增员。但仅购买订阅而未持续投入的公司未见人头增长，可能加剧企业间的资源鸿沟。其他现象/趋势推荐理由：报告用雇佣数据驳斥了「AI消灭就业」的简单说法，付费多的公司反而在扩招甚至增加初级岗，但样本都是快速增长的科技公司，分化隐忧仍在，值得人力决策者细看。

其他现象/趋势

AI HOT · 2026-07-01 01:09

Anthropic：当AI成本超过工程师薪酬

04:34 Tomer Tunguz 博客（VC 分析）精选 58 Anthropic在算力上的支出达到每位工程师每年51.5万美元，是其完全薪资（22.4万美元）的2.3倍。相比之下，顶尖1%软件公司的算力支出为8.9万美元，中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。 Anthropic 大佬观点数据/训练推荐理由： Tomer Tunguz 用数据把 AI 公司的烧钱速度拆得很细，Anthropic 每个工程师年算力成本 51.5 万美元，是工资的 2.3 倍，这个数字对重新理解 SaaS 毛利率很有冲击力。

Anthropic 大佬观点数据/训练

AI HOT · 2026-07-01 01:09

有意思：在GTC 2026宣布Rubin Ultra仅3个月后，原4-die Rubin Ultra因制造执行问题被取消。新的"Rubin Ultra"尺寸减半，实际性能约为原版的一半。1/4🧵

05:01 SemiAnalysis @ SemiAnalysis_ 精选 77 数据/训练行业动态推荐理由： NVIDIA 原版 Rubin Ultra 取消并减半规格是今年硬件领域最大的意外，所有依赖下一代算力增长的公司都得重估路线图。

数据/训练行业动态

AI HOT · 2026-07-01 01:09

为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

05:22 Claude：Blog（网页）精选 66 Anthropic 今日推出 Claude apps gateway，一个自托管控制平面，让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux，后端使用 PostgreSQL，提供企业级 SSO 登录（通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等）、集中策略管理、角色权限、路由（支持故障转移）以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据（除非配置使用 Claude API）。即日起可用。 Anthropic Google 产品更新编码推荐理由： Claude Code企业版有了统一管理入口，SSO和成本控制是团队落地AI编程的关键，对CTO来说值得关注。

Anthropic Google 产品更新编码

AI HOT · 2026-07-01 01:09

AI News Radar 大更新：新增自媒体板块，支持订阅多平台账号

09:50 公众号：卡尔的AI沃茨精选 70 AI News Radar 迎来大更新，新增自媒体板块，支持订阅某书、某音、某站、某X等平台账号，每日按热度推荐 Top10 信息（无热门则不硬凑），同时保留时间轴视图，可在热度优先和时间优先间切换。官方来源包括 OpenAI、Anthropic、Google 等一手消息及 GitHub AI&ML 更新日志。信息流按来源、类型、信号等级分类，标注高优先级与多源认证。项目完全开源，可零 API 部署独立 AI 日报页面，支持手机移动端及暗色界面。 GitHub 产品更新开源生态推荐理由：我觉得这是目前最实用的AI信息过滤工具，新版直接整合了社媒热榜和官方源，内容创作者可以拿来当选题雷达，普通人也能一键部署自己的AI日报，省去每天刷各个平台的时间。

GitHub 产品更新开源生态

AI HOT · 2026-07-01 01:09

具身智能数据采集员：日薪200元起，给机器人当老师

10:10 公众号：数字生命卡兹克精选 67 具身智能数据采集员以日薪200-250元招兼职，无需学历经验。面试先测量身高体重以适配采集手套，并询问是否晕VR。工作分两种：遥操作采集——穿戴设备控制双臂机器人完成分拣积木、叠纸杯等动作；无机器人示教采集——徒手重复动作（如叠衣服），设备记录轨迹。全球高质量物理交互数据截至2026年初仅约50万小时，不足大语言模型训练数据的两万分之一，需大量人力从零采集。具身智能现象/趋势推荐理由：具身智能的数据采集正在催生一种日结兼职，这篇文章把镜头对准了那些教会机器人叠纸杯的普通人，给我一种强烈的割裂感——最前沿的技术和最传统的用工方式在这里合体了。

具身智能现象/趋势

AI HOT · 2026-07-01 01:09

Agents-A1：35B MoE 智能体模型通过扩展 horizon 达到万亿参数级性能

11:26 HuggingFace Daily Papers（社区热门论文）精选 77 研究人员提出 Agents-A1，一个 35B 参数的 Mixture-of-Experts 智能体模型，通过扩展智能体 horizon（长轨迹与异构能力两个视角）达到万亿参数模型性能。团队构建了长 horizon 知识-行动基础设施，生成平均 45K token 的智能体轨迹，并采用三阶段训练：全领域监督微调、领域级教师模型训练、多教师领域路由在线蒸馏（含显著词汇对齐）。对比万亿参数模型 Kimi-K2.6 和 DeepSeek-V4-pro，Agents-A1 在 SEAL-0（56.4）、IFBench（80.6）、HiPhO（46.4）、FrontierScience-Olympiad（79.0）和 MolBench-Bind（56.8）上领先，并在 SciCode（44.3）、HLE（47.6）和 BrowseComp（75.5）上保持强竞争力。智能体推理论文/研究推荐理由：用35B模型追平1T参数模型，这条“扩展智能体视野”的路比无脑堆参数务实得多，做Agent和长程推理的团队必须认真读。

智能体推理论文/研究

AI HOT · 2026-07-01 01:09

一个人管理5款产品，80%时间不写代码？Every的复利工程

11:36 小互 @ xiaohu 精选 81 媒体软件公司Every公开「复利工程」方法论，以单人工程团队维护5款产品。核心是四步循环：Plan→Work→Review→Compound，其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/，使AI下次自动避坑。工程师80%时间花在Plan和Review，仅20%用于写代码。配套开源插件支持Claude Code等，含26个专项agent、23条工作流命令、13项技能，可零配置使用。/workflows:review一次并发14个agent审查代码，/workflows:plan在ultrathink模式下可并发40多个研究agent。智能体教程/实践编码部署/工程推荐理由： Every把内部单人维护5款产品的方法论和插件开源了，14个AI同时审代码、40多个研究agent做计划，是目前公开的多agent并行工程里数字最具体的参考之一，做AI辅助开发的可以直接上手抄。

智能体教程/实践编码部署/工程

AI HOT · 2026-07-01 00:00

Anthropic工程师Margot Van Laar：提示词工程实战--调试生产提示词为主，评估是唯一严谨方式

23:24 Berryxia.AI @ berryxia 精选 77 An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战，核心观点：大部分时间在调试和维护已有生产提示词而非从零编写。两个场景：客服机器人维护中，用XML标签结构化清理，移除旧模型遗留的“禁止列表”指令（新模型会过度拟合），精确计算应调用工具，转人工决策需明确代价与收益；零售排班Agent从零构建时，拆成生成-评估-修复三个简单提示词更稳定，选用更强推理模型（Opus）。她反复强调：评估（Eval）是唯一严谨方式，没有评估就是碰运气。 Berryxia.AI : 睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。... 智能体 Anthropic 推理教程/实践推荐理由： Margot Van Laar把提示词维护讲到了工程级别，评估驱动迭代、清理旧指令、拆分任务循环，这些方法比死记prompt模板重要得多，做AI应用的人都该看一遍。 22:35 Hacker News 热门（buzzing.cc 中文翻译）精选 71 Herdr：驻留在终端中的AI智能体多路复用器 Herdr是一个驻留在终端中的AI智能体多路复用器，允许用户在单一终端界面内管理和切换多个AI智能体会话。智能体 GitHub MCP/工具开源/仓库推荐理由：这个工具把 AI 代理管理塞进终端，比开一堆浏览器标签自然，对命令行重度用户是个值得一试的 early idea。 20:37 The Decoder：AI News（RSS）精选 75 美军用AI选目标却误炸伊朗学校，Anthropic Claude嵌入Palantir系统首日建议约1000目标美军在打击伊朗时首次大规模使用AI选择目标（Anthropic的Claude模型嵌入Palantir的Maven Smart System，首日建议约1000个目标），但对一所学校的导弹袭击导致约120名儿童死亡。调查发现，情报分析师早在2019年就通过数字工具标记该地点已变为小学，但该工具未连接军方官方目标数据库MIDB，信息从未送达指挥官。MIDB建于1980年代，依赖手动输入，替代系统MARS多年延迟。五角大楼事后宣布推出agentic AI initiative。Project Maven创建人Jack Shanahan批评目标验证不力不可原谅。安全/对齐行业动态推荐理由： AI在战场上的首次大规模实战暴露了最可怕的失败模式，不是模型错误，而是情报系统的数据断裂让一个学校被标注为军事目标，120

智能体 Anthropic 推理教程/实践 GitHub MCP/工具开源/仓库安全/对齐行业动态多模态论文/研究 arXiv 产品更新 OpenAI 现象/趋势编码政策/监管部署/工程数据/训练开源生态模型发布