AI HOT
·
2026-06-09 04:26
22:46 OpenBMB @ OpenBMB 精选 75 面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。 多模态 开源/仓库 模型发布 语音 推荐理由: 面壁把语音生成压进2B参数,支持30种语言加方言克隆,还附完整技术报告和Apache 2.0开源,做语音产品的可以直接拉代码跑起来了。
多模态
开源/仓库
模型发布
语音
AI HOT
·
2026-06-09 04:26
23:12 Chubby♨️ @ kimmonismus 精选 78 Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。 Davit : Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod... 智能体 开源/仓库 编码 推荐理由: Hivemind 让 Claude Code、Cursor 等不同 AI 编码助手互相学习,团队用得越多代理越准,开源一行安装,做工程管理的值得立刻试试。
智能体
开源/仓库
编码
AI HOT
·
2026-06-09 04:26
04:19 ClaudeDevs @ ClaudeDevs 精选 64 Anthropic MCP/工具 产品更新 推荐理由: 如果你是 Claude 连接器开发者,这个仪表盘能让你一眼看清 MCP 工具的调用状况,MCP 生态的成熟速度比预想的快。 03:14 Apple:Newsroom(RSS) 精选 65 受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线 由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。 政策/监管 语音 关联讨论 1 条 IT之家(RSS) 推荐理由: 虽然只是欧盟地区延迟,但Siri AI因DMA无法落地是个全行业信号——监管已经开始直接拦截AI功能,做全球产品的必须认真看政策风险了。 03:14 Apple:Newsroom(RSS) 精选 72 Apple Intelligence 将强大 AI 能力融入日常体验 Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。 产品更新 多模态 推荐理由: 苹果这次把AI能力直接嵌进iPhone、iPad和Mac的核心体验,不是噱头而是日常能用上的东西,想知道你的设备接下来会变成什么样,这篇必看。 03:14 Apple:Newsroom(RSS) 精选 56 Apple发布新一代Apple Intelligence和Siri AI 今天Apple预览了即将推出的软件版本,将带来新一代Apple Intelligence和Siri AI。 产品更新 端侧 语音 关联讨论 7 条 The Verge:AI(RSS) TechCrunch:AI(RSS) X:Testing Catalog (@testingcatalog) Bloomberg:Technology(RSS) The Verge:订阅版科技(RSS) IT之家(RSS) Apple:Newsroom(RSS) 推荐理由: 苹果AI的下一次迭代预览,虽然还只是预告,但Siri AI这个提法可能意味着更彻底的助手进化,iOS开发者该盯紧后续细节。 02:51 Anthropic @ AnthropicAI 精选 61 新的科学博客:为什么 AI 在编码方面的进步比在生物学方面更快? 对智能体而言,生物数据库就像汽车发明前建造的城市--开进去会让人抓狂,因为它们是针对不同的交通流量设计的。 我们如何构建智能体可以使用的基础设施? https://www.anthropic.com/research/agents-in-biology 智能体 Ant
Anthropic
MCP/工具
产品更新
政策/监管
语音
多模态
端侧
智能体
现象/趋势
编码
行业动态
大佬观点
数据/训练
论文/研究
教程/实践
DeepSeek
开源生态
推理
OpenAI
Google
图像生成
视频
AI HOT
·
2026-06-09 03:20
03:14 Apple:Newsroom(RSS) 精选 80 Apple 发布了 Siri AI,一款由 Apple Intelligence 驱动的个人助理,具备个人上下文、世界知识和屏幕感知能力,能提供更强大、更个性化的交互体验。 智能体 产品更新 推荐理由: Apple 把 Siri 重做成真正的 AI 助手,个人上下文+屏幕感知如果做成了,这是普通用户离 AI 最近的一次。
智能体
产品更新
AI HOT
·
2026-06-09 02:13
17:42 公众号:数字生命卡兹克 精选 71 腾讯正测试嵌入微信的AI Agent,用户右滑唤出对话窗口,通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,可通过手机语音助理发起微信音视频通话或发送消息。6月8日,微信官方发布《关于开发者接入微信AI生态的指引》,提供自动接入模式,利用微信沙箱全自动改造小程序,使其可被AI直接调用。这一布局被视为Agentic Commerce(代理式交易)的雏形。 智能体 MCP/工具 现象/趋势 推荐理由: 微信想用Agent把小程序生态变成操作系统,靠Agentic Commerce抽佣,一旦跑通,想象力比广告大得多。
智能体
MCP/工具
现象/趋势
AI HOT
·
2026-06-09 02:13
18:00 公众号:通义实验室(千问) 精选 68 通义实验室教程演示了如何用 Agent(Qoder)辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括:检查 JDK 21、NDK 27、CMake 3.18.1 等环境;创建 arm64-v8a 的 Native C++ 工程(minSdk 29、compileSdk 35);通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型;编译开启 LLM 视觉支持(MNN_BUILD_LLM、LLM_SUPPORT_VISION)的 libMNN.so;构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面,输出 MNN 版本(v3.5.0)、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。 多模态 推理 教程/实践 端侧 推荐理由: 用Agent辅助走通Qwen3-VL安卓端侧推理全流程,从环境搭建到JNI桥接一步到位。如果你在做移动端AI应用,这可能是目前最详细的实战指南,可以直接抄作业。
多模态
推理
教程/实践
端侧
AI HOT
·
2026-06-09 02:13
18:10 Alibaba Cloud @ alibaba_cloud 精选 66 智能体 开源/仓库 部署/工程 推荐理由: 虽然阿里云的 AgentScope 没有 LangChain 知名,但 Java 2.0 版直接在 K8s 上做分布式 agent,多租户隔离和会话恢复是真实企业需求,做 Java 的值得看看。
智能体
开源/仓库
部署/工程
AI HOT
·
2026-06-09 02:13
19:50 Hugging Face:Blog(RSS) 精选 74 Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。 Hugging Face 多模态 教程/实践 推荐理由: 一个只有4B的小模型,把巴基斯坦本地诈骗文案分析得明明白白,比那些参数大但看不懂乌尔都语的通用模型实用得多。做给特定地区特定问题的小工具,这才是AI落地的真节奏。
Hugging Face
多模态
教程/实践
AI HOT
·
2026-06-09 02:13
21:36 小互 @ xiaohu 精选 79 小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。 GitHub 开源/仓库 视频 语音 推荐理由: 小互把自己用了半年的视频翻译工具开源了,本地Whisper转写加AI润色,下载、翻译、烧字幕一句话搞定,做海外视频搬运或想省时间的,装一下就能省掉大半天手工。
GitHub
开源/仓库
视频
语音
AI HOT
·
2026-06-09 02:13
21:50 Hugging Face:Blog(RSS) 精选 57 用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。 智能体 大佬观点 推荐理由: 做 agent 的人必读,自己动手构建一个多模型经济体后才发现,涌现行为脆弱,控制要卡在结算层而非输入层,廉价模拟器会给你虚假信心。这篇复盘比成功案例更值钱。
智能体
大佬观点
AI HOT
·
2026-06-09 02:13
21:50 Hugging Face:Blog(RSS) 精选 62 今日,Hugging Face 宣布 OpenEnv 项目进一步开放,由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调,并获得 PyTorch Foundation、vLLM、SkyRL(UCB)等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具,定位为训练器与环境间的互操作层,标准化环境的发布、部署和消费,但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API(`reset()`、`step()`、`state()`),支持 HTTP、WebSocket、Docker 打包,并将 MCP 作为一等公民,使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证,以推动开源智能体 RL 基础建设。 智能体 Hugging Face MCP/工具 Meta 推荐理由: 开源社区在 agent RL 环境上终于开始合流,Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准,不做奖励框架,只做插线板。搞开源 agent 训练的人,这是少有的统一基础设施的机会。
智能体
Hugging Face
MCP/工具
Meta
AI HOT
·
2026-06-09 02:13
22:02 公众号:月之暗面(Kimi) 精选 76 Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。 智能体 产品更新 开源生态 编码 推荐理由: Kimi Code 这次更新把安装和视频处理的门槛压到了最低,一行命令加拖拽视频就能用,开源 Agent 的体验终于开始反超商业版本。
智能体
产品更新
开源生态
编码
AI HOT
·
2026-06-09 01:07
16:20 IT之家(RSS) 精选 73 微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。 智能体 MCP/工具 产品更新 推荐理由: 微信终于把AI塞进了自家生态,没做聊天机器人而是直接让AI操作小程序,这个方向比所有独立AI助手都更贴近普通人的真实需求,做小程序的得赶紧看了。
智能体
MCP/工具
产品更新
AI HOT
·
2026-06-09 01:07
16:38 meng shao @ shao__meng 精选 78 邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill,并开源 Brand to DESIGN.md Skill(GitHub: shaom/brand-to-design-md-skill),让 Agent 学习设计品味后复刻网站。但他指出,这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”,缺少设计精髓,仅皮毛相仿。 智能体 GitHub 开源/仓库 推荐理由: 邵猛这个 skill 把品牌手册一键转成 Agent 可用的 DESIGN.md,虽然 AI 复刻设计仍缺灵魂,但至少能让 Agent 立刻有规范可循,做设计的可以直接套用。
智能体
GitHub
开源/仓库
AI HOT
·
2026-06-09 01:07
17:32 公众号:生数科技(Vidu·视频) 精选 63 生数科技与华策集团达成战略合作,共建AIGC影视创制中心,推动AI与影视产业融合落地。合作聚焦于利用生数科技的AI视频生成能力(Vidu),结合华策集团的影视行业资源,探索AIGC在影视制作全流程中的应用,包括剧本生成、预可视化、特效制作等环节。双方将通过技术研发与场景验证,加速AI在影视行业的规模化落地。 行业动态 视频 推荐理由: Vidu 背后的生数科技和国内头部影视集团华策联手,不是 PR 姿态,是 AI 视频生成真正进入产业链的明确信号,做影视和广告的可以盯着看落地节奏。
行业动态
视频
AI HOT
·
2026-06-09 00:00
14:14 Tencent Hy @ TencentHunyuan 精选 69 腾讯混元联合上海交大、南洋理工等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估AI语音/音频编辑能力的基准。MMAE要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于5%,暴露了可靠音频编辑的短板。MMAE包含2000个真实场景高保真样本、17741条细粒度评估项,覆盖声音/音乐/语音及混合共7种模态、6种任务复杂度(基础修改到多跳推理及多轮编辑)、8种操作类型(局部到全局)。论文、代码、数据集和演示已公开。 多模态 论文/研究 语音 推荐理由: 过去一年语音和音乐生成很热,但音频编辑还没人正经测过,腾讯这个基准把现状血淋淋地摆出来了,不到5%的准确率意味着整个方向都还在起步期。
多模态
论文/研究
语音
AI HOT
·
2026-06-09 00:00
14:20 IT之家(RSS) 精选 73 阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述,10分钟即可在消费级GPU上生成公里级3D城市,输出可编辑3DGS格式,可直接导入Unity等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往abot-earth.amap.com提交申请。 具身智能 多模态 模型发布 推荐理由: 第一个把分钟级 3D 城市重建拉进消费级 GPU 的世界模型,成本打到了传统方案的百分之一,对具身智能和低空经济是底层能力补全,值得内测试试。
具身智能
多模态
模型发布
AI HOT
·
2026-06-09 00:00
16:08 PixVerse @ PixVerse_ 精选 65 Stephen Cadigan : PixVerse. I met the leadership of the company face-to-face in Berlin this February. More on that some other time. I've b... 产品更新 视频 推荐理由: PixVerse把创作者激励真的做成了可量化的积分加现金,每周最高150k credits和2500美金奖金池,做AI视频的可以试试,虽然不是全行业大事,但够务实。
产品更新
视频
AI HOT
·
2026-06-09 00:00
16:11 Bloomberg:Technology(RSS) 精选 70 CoreWeave 对当前计算市场进行了分析,指出推动增长的因素和限制增长的因素。该公司的市场看法即围绕这两个维度展开。 行业动态 部署/工程 推荐理由: CoreWeave 作为 AI 算力的「卖铲人」,对计算市场的判断能摸到真实供需的脉搏,做基础设施的人该看一眼。
行业动态
部署/工程
AI HOT
·
2026-06-09 00:00
23:54 OpenRouter @ OpenRouter 精选 66 OpenRouter : New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,... 智能体 产品更新 部署/工程 推荐理由: OpenRouter 发布 Advisor 工具,让便宜模型在陷入死循环时请求大模型协助,这算在稳定性和成本间取了个巧,跑大量 agent 的团队能省一笔实在钱。 23:24 OpenRouter @ OpenRouter 精选 72 新服务器工具:Advisor 让较小的模型咨询一个更高智能的"顾问"模型。 帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵 智能体 MCP/工具 产品更新 推荐理由: OpenRouter 这个 Advisor 工具,用大模型给小模型当顾问,专治死循环。想降本到小模型又怕质量跳水的团队,可以试试这个方案。 23:12 Chubby♨️ @ kimmonismus 精选 78 Hivemind推出面向AI编程智能体的持续学习功能,即日起开放 Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。 Davit : Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod... 智能体 开源/仓库 编码 推荐理由: Hivemind 让 Claude Code、Cursor 等不同 AI 编码助手互相学习,团队用得越多代理越准,开源一行安装,做工程管理的值得立刻试试。 22:46 OpenBMB @ OpenBMB 精选 75 VoxCPM2 技术报告发布 面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用
智能体
产品更新
部署/工程
MCP/工具
开源/仓库
编码
多模态
模型发布
语音
推理
Microsoft
大佬观点
Hugging Face
Meta
GitHub
视频
教程/实践
端侧
行业动态
具身智能
论文/研究
OpenAI
政策/监管
11 / 60