AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

苹果 WWDC 2026 直播

02:31 Hacker News 热门(buzzing.cc 中文翻译) 精选 73 苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。 编码 行业动态 推荐理由: 苹果一年最重要的开发者大会,iOS 和 macOS 的新功能直接影响数亿用户,所有关于 Apple Intelligence 的传闻都会在这里揭晓,生态开发者必看。

编码 行业动态
AI HOT ·

Claude 为 Connector 开发者推出性能监控仪表盘

02:50 Claude:Blog(网页) 精选 72 Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。 Anthropic MCP/工具 产品更新 关联讨论 1 条 X:Claude Devs (@ClaudeDevs) 推荐理由: Claude给connector开发者加了仪表板,能跟踪用量和错误,还能直接提交到目录,做MCP集成的省了监控的麻烦,即开即用。

Anthropic MCP/工具 产品更新
AI HOT ·

AI 替代浪潮:三大力量重塑成本结构

00:41 Tomer Tunguz 博客(VC 分析) 精选 56 三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。 Anthropic DeepSeek 开源生态 推理 推荐理由: Tunguz 用 Coinbase、Lindy 等真实案例,把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了,做 AI 应用的人该重新算一下单位经济账。

Anthropic DeepSeek 开源生态 推理
AI HOT ·

我们与哈佛大学发表新研究,关于从聊天界面转向像Computer这样的自主智能体的转变。 超过3个月的研究结果表明,使用Computer的工人在完成任务上比仅使用搜索快87%,成本低94%,且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

00:57 Perplexity @ perplexity_ai 精选 76 智能体 论文/研究 推荐理由: Perplexity 和哈佛的联合研究,用三个月数据把“AI 代理取代聊天界面”从口号变成了硬数字——87% 时间缩减和 94% 成本下降,做企业决策的人该仔细读一下。

智能体 论文/研究
AI HOT ·

推出更强大的 NotebookLM 🚀 重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。 现已面向 Google AI Ultra 订阅者推出。

00:19 NotebookLM @ NotebookLM 精选 72 Google 产品更新 多模态 推理 关联讨论 1 条 X:NotebookLM (@NotebookLM) 推荐理由: NotebookLM 这次升级把 agent 能力塞进聊天框,从被动答案变成能拆解多步研究,对深度资料整理的人是真迭代,但仅限 Google AI Ultra 订阅,门槛不低。

Google 产品更新 多模态 推理
AI HOT ·

OpenAI 秘密提交 IPO 申请,加入 AI 对手上市融资竞赛

05:45 Bloomberg:Technology(RSS) 精选 81 ChatGPT 开发商 OpenAI 已秘密提交首次公开募股(IPO)申请,加入人工智能竞争对手行列,通过公开市场为雄心勃勃的增长计划筹集资金。 OpenAI 行业动态 关联讨论 2 条 Bloomberg:Technology(RSS) TechCrunch:AI(RSS) 推荐理由: OpenAI 秘密提交 IPO,意味着 AI 行业从烧钱竞赛走向资本市场公开赛,这比任何模型发布都更能定义下一个五年,所有关注 AI 的人都应该看清这个转折。 05:42 Rohan Paul @ rohanpaul_ai 精选 79 Sam Altman关于OpenAI未来路径的新博客称,到2028年3月,其大量研究将由AI完成。 该路径主要有3个目标:构建自动AI研究员,利用它加速科学和生产,然后给每个人一个个人AGI,帮助处理工作、学习、编程、商业、健康文书和决策。 Sam Altman : Here is our current plan for OpenAI: https://openai.com/index/built-to-benefit-everyone-our-plan/ OpenAI 大佬观点 推荐理由: Sam Altman 首次把 OpenAI 的路线图讲得这么清楚,自动化 AI 研究员、加速科学、每个人一个 AGI,三条线直指 2028,比任何单个模型发布都更能定调行业节奏。 05:16 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 89 OpenAI 向 SEC 机密提交 S-1 草案,上市时间未定 OpenAI 近日向 SEC 机密提交了 S-1 草案(即首次公开募股注册声明),目前尚未决定上市时间。 OpenAI 行业动态 推荐理由: OpenAI 秘密提交 S-1 意味着 IPO 正式进入流程,即便没有公开时间表,这也是 AI 史上最大的上市动作之一,影响远超融资新闻。 05:15 Apple Machine Learning Research(RSS) 精选 79 苹果发布第三代 Apple Foundation Models(AFM) 苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能,包括全新 Siri 和智能工具,以用户为中心深度融合操作系统,隐私为核心设计原则。 Google 多模态 模型发布 端侧 关联讨论 1 条 Hacker News 热门(buzzing.cc 中文翻译) 推荐理由: Apple与Google罕见联

OpenAI 行业动态 大佬观点 Google 多模态 模型发布 端侧 智能体 产品更新 视频 政策/监管 安全/对齐 语音 Anthropic 现象/趋势 MCP/工具 编码 数据/训练 论文/研究 教程/实践 DeepSeek 开源生态 推理 图像生成
AI HOT ·

新服务器工具:Advisor 让较小的模型咨询一个更高智能的"顾问"模型。 帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵

23:24 OpenRouter @ OpenRouter 精选 72 智能体 MCP/工具 产品更新 关联讨论 1 条 X:OpenRouter (@OpenRouter) 推荐理由: OpenRouter 这个 Advisor 工具,用大模型给小模型当顾问,专治死循环。想降本到小模型又怕质量跳水的团队,可以试试这个方案。 23:12 Chubby♨️ @ kimmonismus 精选 78 Hivemind推出面向AI编程智能体的持续学习功能,即日起开放 Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。 Davit : Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod... 智能体 开源/仓库 编码 推荐理由: Hivemind 让 Claude Code、Cursor 等不同 AI 编码助手互相学习,团队用得越多代理越准,开源一行安装,做工程管理的值得立刻试试。 22:46 OpenBMB @ OpenBMB 精选 75 VoxCPM2 技术报告发布 面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。 多模态 开源/仓库 模型发布 语音 推荐理由: 面壁把语音生成压进2B参数,支持30种语言加方言克隆,还附完整技术报告和Apache 2.0开源,做语音产品的可以直接拉代码跑起来了。 22:40 Xiaomi MiMo @ XiaomiMiMo 精选 82 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 小米 MiMo 联合 TileRT_AI 发布

智能体 MCP/工具 产品更新 开源/仓库 编码 多模态 模型发布 语音 推理 部署/工程 Microsoft 大佬观点 开源生态 Hugging Face Meta GitHub 视频 教程/实践 端侧 现象/趋势 行业动态 具身智能 论文/研究 OpenAI
AI HOT ·

一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。

00:08 Runway @ runwayml 精选 79 产品更新 图像生成 视频 推荐理由: Runway 把视频重构图做成了上传即填充,Aleph 2.0 自动补全不同比例画面,对同时做横竖版内容的人太实用,省掉重新拍摄或手动裁剪的功夫。

产品更新 图像生成 视频
AI HOT ·

微软AI CEO:超级智能即将到来,但不会取代你的工作

22:08 The Verge:AI(RSS) 精选 79 微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。 Microsoft 大佬观点 关联讨论 1 条 The Verge:订阅版科技(RSS) 推荐理由: Mustafa 首次系统阐述微软的「自给自足」路线,一边甩开 OpenAI 一边定义「人文主义超级智能」,开发者和产品人都该听听这段博弈论。

Microsoft 大佬观点
AI HOT ·

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

22:40 Xiaomi MiMo @ XiaomiMiMo 精选 82 小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。 推理 模型发布 部署/工程 关联讨论 1 条 Hacker News 热门(buzzing.cc 中文翻译) 推荐理由: 小米用单节点8卡标准GPU在1T MoE模型上跑出1000+ tokens/s,没有走晶圆级或专用芯片的路子,直接把推理成本门槛拉低了一大截,做实时对话和Agent的可以申请免费聊天先上手感受一下。

推理 模型发布 部署/工程
AI HOT ·

VoxCPM2 技术报告发布

22:46 OpenBMB @ OpenBMB 精选 75 面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。 多模态 开源/仓库 模型发布 语音 推荐理由: 面壁把语音生成压进2B参数,支持30种语言加方言克隆,还附完整技术报告和Apache 2.0开源,做语音产品的可以直接拉代码跑起来了。

多模态 开源/仓库 模型发布 语音
AI HOT ·

Hivemind推出面向AI编程智能体的持续学习功能,即日起开放

23:12 Chubby♨️ @ kimmonismus 精选 78 Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。 Davit : Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod... 智能体 开源/仓库 编码 推荐理由: Hivemind 让 Claude Code、Cursor 等不同 AI 编码助手互相学习,团队用得越多代理越准,开源一行安装,做工程管理的值得立刻试试。

智能体 开源/仓库 编码
AI HOT ·

我们为连接器开发者添加了一个可观测性仪表盘。 连接器让第三方开发者能够通过MCP将他们的工具和数据带到Claude。

04:19 ClaudeDevs @ ClaudeDevs 精选 64 Anthropic MCP/工具 产品更新 推荐理由: 如果你是 Claude 连接器开发者,这个仪表盘能让你一眼看清 MCP 工具的调用状况,MCP 生态的成熟速度比预想的快。 03:14 Apple:Newsroom(RSS) 精选 65 受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线 由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。 政策/监管 语音 关联讨论 1 条 IT之家(RSS) 推荐理由: 虽然只是欧盟地区延迟,但Siri AI因DMA无法落地是个全行业信号——监管已经开始直接拦截AI功能,做全球产品的必须认真看政策风险了。 03:14 Apple:Newsroom(RSS) 精选 72 Apple Intelligence 将强大 AI 能力融入日常体验 Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。 产品更新 多模态 推荐理由: 苹果这次把AI能力直接嵌进iPhone、iPad和Mac的核心体验,不是噱头而是日常能用上的东西,想知道你的设备接下来会变成什么样,这篇必看。 03:14 Apple:Newsroom(RSS) 精选 56 Apple发布新一代Apple Intelligence和Siri AI 今天Apple预览了即将推出的软件版本,将带来新一代Apple Intelligence和Siri AI。 产品更新 端侧 语音 关联讨论 7 条 The Verge:AI(RSS) TechCrunch:AI(RSS) X:Testing Catalog (@testingcatalog) Bloomberg:Technology(RSS) The Verge:订阅版科技(RSS) IT之家(RSS) Apple:Newsroom(RSS) 推荐理由: 苹果AI的下一次迭代预览,虽然还只是预告,但Siri AI这个提法可能意味着更彻底的助手进化,iOS开发者该盯紧后续细节。 02:51 Anthropic @ AnthropicAI 精选 61 新的科学博客:为什么 AI 在编码方面的进步比在生物学方面更快? 对智能体而言,生物数据库就像汽车发明前建造的城市--开进去会让人抓狂,因为它们是针对不同的交通流量设计的。 我们如何构建智能体可以使用的基础设施? https://www.anthropic.com/research/agents-in-biology 智能体 Ant

Anthropic MCP/工具 产品更新 政策/监管 语音 多模态 端侧 智能体 现象/趋势 编码 行业动态 大佬观点 数据/训练 论文/研究 教程/实践 DeepSeek 开源生态 推理 OpenAI Google 图像生成 视频
AI HOT ·

Apple 推出 Siri AI:由 Apple Intelligence 驱动的更强大、更个性化的个人助理

03:14 Apple:Newsroom(RSS) 精选 80 Apple 发布了 Siri AI,一款由 Apple Intelligence 驱动的个人助理,具备个人上下文、世界知识和屏幕感知能力,能提供更强大、更个性化的交互体验。 智能体 产品更新 推荐理由: Apple 把 Siri 重做成真正的 AI 助手,个人上下文+屏幕感知如果做成了,这是普通用户离 AI 最近的一次。

智能体 产品更新
AI HOT ·

微信AI Agent生态曝光:嵌入小程序调用与手机厂商合作

17:42 公众号:数字生命卡兹克 精选 71 腾讯正测试嵌入微信的AI Agent,用户右滑唤出对话窗口,通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,可通过手机语音助理发起微信音视频通话或发送消息。6月8日,微信官方发布《关于开发者接入微信AI生态的指引》,提供自动接入模式,利用微信沙箱全自动改造小程序,使其可被AI直接调用。这一布局被视为Agentic Commerce(代理式交易)的雏形。 智能体 MCP/工具 现象/趋势 推荐理由: 微信想用Agent把小程序生态变成操作系统,靠Agentic Commerce抽佣,一旦跑通,想象力比广告大得多。

智能体 MCP/工具 现象/趋势
AI HOT ·

Agent 辅助开发,一站式打通 Qwen3-VL Android 端侧推理

18:00 公众号:通义实验室(千问) 精选 68 通义实验室教程演示了如何用 Agent(Qoder)辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括:检查 JDK 21、NDK 27、CMake 3.18.1 等环境;创建 arm64-v8a 的 Native C++ 工程(minSdk 29、compileSdk 35);通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型;编译开启 LLM 视觉支持(MNN_BUILD_LLM、LLM_SUPPORT_VISION)的 libMNN.so;构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面,输出 MNN 版本(v3.5.0)、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。 多模态 推理 教程/实践 端侧 推荐理由: 用Agent辅助走通Qwen3-VL安卓端侧推理全流程,从环境搭建到JNI桥接一步到位。如果你在做移动端AI应用,这可能是目前最详细的实战指南,可以直接抄作业。

多模态 推理 教程/实践 端侧
AI HOT ·

阿里云发布AgentScope Java 2.0,面向企业级AI智能体开发。新版本主要特性:分布式无状态架构,支持K8s弹性扩缩容与会话恢复;多租户隔离,通过Workspace抽象实现安全数据分离;长期稳定性,HarnessAgent负责上下文管理与容错;安全执行,提供细粒度权限控制和Human-in-the-Loop支持。适用于JVM生产环境。开源地址见推文链接。

18:10 Alibaba Cloud @ alibaba_cloud 精选 66 智能体 开源/仓库 部署/工程 推荐理由: 虽然阿里云的 AgentScope 没有 LangChain 知名,但 Java 2.0 版直接在 K8s 上做分布式 agent,多租户隔离和会话恢复是真实企业需求,做 Java 的值得看看。

智能体 开源/仓库 部署/工程
AI HOT ·

Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具

19:50 Hugging Face:Blog(RSS) 精选 74 Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。 Hugging Face 多模态 教程/实践 推荐理由: 一个只有4B的小模型,把巴基斯坦本地诈骗文案分析得明明白白,比那些参数大但看不懂乌尔都语的通用模型实用得多。做给特定地区特定问题的小工具,这才是AI落地的真节奏。

Hugging Face 多模态 教程/实践
AI HOT ·

小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕

21:36 小互 @ xiaohu 精选 79 小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。 GitHub 开源/仓库 视频 语音 推荐理由: 小互把自己用了半年的视频翻译工具开源了,本地Whisper转写加AI润色,下载、翻译、烧字幕一句话搞定,做海外视频搬运或想省时间的,装一下就能省掉大半天手工。

GitHub 开源/仓库 视频 语音