AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

超越LLM:为何可扩展的企业AI采用取决于智能体逻辑

22:38 Hugging Face:Blog(RSS) 精选 60 可扩展的企业AI采用需超越大语言模型,依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流,从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例,展示了智能体逻辑如何通过程序分析等技术,在理解大型遗留代码库时,相比纯LLM基线方法,能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中,该方法亦能使代码覆盖度提升20%-45%,同时token消耗降低最高达15倍。 智能体 推理 现象/趋势 部署/工程 推荐理由: 不是又一篇炒作 agent 的文章,IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。

智能体 推理 现象/趋势 部署/工程
AI HOT ·

为改善人类生活,AI系统必须能帮助我们改善物理世界。阻碍我们迈向这一繁荣未来的是物理AI的泛化问题。 为解决此问题,我们在Luma建立了一个新的开放科学物理AI实验室。 阅读更多 → https://lumalabs.ai/news/luma-open-physical-ai-lab

23:15 Luma @ LumaLabsAI 精选 62 具身智能 行业动态 推荐理由: Luma 正式下场物理 AI,这个开放实验室的调门不低,直接对标泛化问题。虽然还没东西,但方向很对,做机器人的可以把它标个星。

具身智能 行业动态
AI HOT ·

Alphabet将筹集800亿美元为AI支出提供资金

05:44 Bloomberg:Technology(RSS) 精选 78 Google的母公司Alphabet计划筹集800亿美元的股权资本,以支付其雄心勃勃的人工智能支出计划。 Google 行业动态 推荐理由: Alphabet直接融资800亿美元专款用于AI,这个金额相当于两个OpenAI的估值,说明AI军备竞赛已经打到明牌了,所有还在犹豫投入的公司都得重新算账。

Google 行业动态
AI HOT ·

OpenAI前沿模型和Codex现已在AWS上全面可用。企业可以通过Amazon Bedrock服务,利用其已有的安全、合规与治理工作流,来构建基于OpenAI的AI应用及软件工程工作流。此次上线是OpenAI能力在AWS上更广泛扩展的开始,未来还将包括Daybreak等网络安全功能的可用性。

05:47 OpenAI Developers @ OpenAIDevs 精选 73 OpenAI : OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed... OpenAI 产品更新 部署/工程 推荐理由: OpenAI 模型正式上架 AWS Bedrock,这不是技术突破,但对企业客户是实质利好——能用已有的安全合规体系直接调用前沿模型,AI 落地的最后一公里阻力大幅减小。

OpenAI 产品更新 部署/工程
AI HOT ·

作者分享使用 Codex App 开发的开源项目合集

22:04 向阳乔木 @ vista8 精选 80 作者分享了使用 Codex App 等工具开发的一系列开源项目,包括4个 Chrome 插件(如快捷提示词、新标签页)、4个网站(如艺术家风格对比、音乐展示)和5个 AI Skill(如论文解读、阅读助手)。项目基于 GPT-Image-2 API、Suno 等技术,并整合了 Read-frog、Hyperframe 等开源项目。 开源生态 教程/实践 编码 推荐理由: 乔木一口气开源了8个工具和5个Skill,从提示词插件到Suno音乐制作,看完就能直接用,做内容和开发的读完可以少写半个月代码。

开源生态 教程/实践 编码
AI HOT ·

开源与闭源模型在不同的增长曲线上

22:06 Nathan Lambert:Interconnects(RSS) 精选 66 当模型智能的微小提升能直接转化为实际价值时,开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成了差异化的竞争格局。 大佬观点 开源生态 推荐理由: Nathan Lambert 这篇文章一反所有人都在讨论「开源能否追上闭源」的调调,直接指出两者走的根本不是同一条增长曲线,做产品选型的真该看看。

大佬观点 开源生态
AI HOT ·

视频教程:如何构建一个每周预算上限为1000美元的智能体,包含模型拒绝列表与自定义数据保留 使用了新的、可堆叠的护栏架构: 【引用 @OpenRouter】:OpenRouter 上的护栏是市场上最强大的:为您的 AI 流量提供集中式安全与治理 预算限制、ZDR、模型与提供商限制、提示词注入防御以及 DLP / 敏感信息检测,分层为您控制的规则!🧵

22:25 OpenRouter @ OpenRouter 精选 75 OpenRouter : Guardrails on OpenRouter are the most powerful in the market: centralized security & governance for your AI traffic Budg... 智能体 安全/对齐 教程/实践 推荐理由: 如果你在跑 agent 并担心成本爆炸,OpenRouter 这个教程手把手教你设预算上限和注入防御,抄完就能上线,别再裸奔了。

智能体 安全/对齐 教程/实践
AI HOT ·

大规模评估智能体行为,论证代码库优于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。

21:55 Microsoft Research @ MSFTResearch 精选 63 智能体 Microsoft 安全/对齐 现象/趋势 推荐理由: 微软研究院这期 Research Focus 直接点出 agent 评估、repo 优于 doc、价值对齐三个方向,做智能体和对齐的开发者值得深挖一下。

智能体 Microsoft 安全/对齐 现象/趋势
AI HOT ·

ICYMI:我们最新的 AI Pulse 探讨了日活跃智能体(DAA)--一个衡量智能体时代价值的指标--以及我们的智能体组合。

22:03 Baidu Inc. @ Baidu_Inc 精选 62 Baidu Inc. : http://x.com/i/article/2060155258350014464 智能体 现象/趋势 推荐理由: 百度提出 Daily Active Agents 度量,试图给 Agent 产品定个价值标尺,做 Agent 的产品人可以看看这个思路,尽管它还需要行业共识。

智能体 现象/趋势
AI HOT ·

使用Claude Opus 4.8将书籍转化为AI技能的教程

20:48 AYi @ AYi_AInotes 精选 79 本文以《非暴力沟通》为例,提供了一个将书籍转化为可调用AI技能(Skill)的六步教程。作者使用Claude Opus 4.8模型,因其具备100万token上下文窗口、结构化输出及多步智能体(Agent)能力,能一次性处理全书逻辑。流程包含文本准备、全局结构分析、五类提炼(框架/原则/技法/反模式/作者声音)、技能生成及关键的自检步骤。生成的技能保留了书中原始框架命名(如OFNR四要素、长颈鹿语言),并将触发词优化为“怎么提意见不像在指责”等日常表达。整个流程耗时约45分钟,消耗约30万token,成本不到20元人民币。 开源/仓库 教程/实践 推荐理由: 不是摘要,是真能用的skill。把整本书喂给Claude Opus 4.8,提炼成能随时唤起的工具箱,连自检步骤都帮你做好了,想把自己读过但用不上的书激活的,直接抄。

开源/仓库 教程/实践
AI HOT ·

王兴:美团 AI Agent"小美"与腾讯元宝即将深度合作,用户订单无缝连接

21:05 IT之家(RSS) 精选 73 美团2026年第一季度财报显示营收910.39亿元,净利润亏损68.27亿元。财报电话会上,CEO王兴透露其AI Agent“小美”将与腾讯元宝深度合作。用户在腾讯元宝中提交本地服务需求,将被无缝连接至美团的外卖点餐、配送等生态。王兴强调,面向智能体的服务(To A)正变得日益重要,美团已将AI助手“小团”置于App核心位置,并拓展AI服务外延。 智能体 MCP/工具 行业动态 推荐理由: 美团把「小美」接进腾讯元宝,是Agent在本地生活服务里落地的明确信号,虽然还是早期合作,但「服务AI Agent」这个提法值得留意。

智能体 MCP/工具 行业动态
AI HOT ·

OpenBMB发布UltraData两大开源数据集,登顶HuggingFace趋势榜

21:12 OpenBMB @ OpenBMB 精选 78 OpenBMB联合清华NLP与Modelbest发布两个开源数据集:Ultra-FineWeb-L3(预训练合成数据)包含600B+ tokens(超400B英文、200B+中文),是迄今最大开源中文预训练合成数据集;UltraData-SFT-2605(后训练SFT数据)包含15M+样本,是中国首个开源且包含思考与非思考标注的大规模SFT数据集,覆盖数学、代码、知识和指令遵循。两者均基于UltraData L0-L4框架构建,并在MiniCPM5-1B训练中完成验证。数据集已在HuggingFace免费开放。 Hugging Face 开源/仓库 数据/训练 推荐理由: 面壁开源了两个王炸数据集,预训练的 600B+ token 中文合成数据史上最大,SFT 那边 1500 万条带思考链的指令更是头一回见,做中文基础模型的可以无脑下载了。

Hugging Face 开源/仓库 数据/训练
AI HOT ·

Runway 在伦敦设立欧洲总部及世界模型研究中心

18:24 Runway:News(网页) 精选 65 Runway 宣布在伦敦建立新的欧洲总部和专注于通用世界模型的研究中心。公司计划在未来18个月向英国AI生态投资$100M,到2028年投资额将翻倍以上。过去12个月,其在欧洲的订阅销量增长了50%,企业客户占比超20%。新总部将扩大其在欧洲的研究与商业布局,公司正招聘欧洲负责人以组建跨研究、产品、工程和销售的团队,并深化与BBC、Fremantle、WPP等企业的合作。世界模型是其研究的核心,旨在将生成式AI的应用扩展至机器人、科学研究与工业模拟等领域。 行业动态 视频 关联讨论 1 条 X:Runway (@runwayml) 推荐理由: Runway把研究重心放到伦敦,100M投资不小,对欧洲AI创业者和创作者是个信号,但本质还是区域扩张,技术惊喜不多,可以过一眼。

行业动态 视频
AI HOT ·

🚀 Apache RocketMQ 为 AI 升级!推出 RocketMQ for AI--一个专为长时间会话、多智能体工作流和公平资源调度构建的新消息引擎。凭借 Lite-Topics、有序消息和智能流量整形,它解决了状态丢失、级联故障和突发负载问题。由阿里云大规模构建,现已开源。 了解更多: https://int.alibabacloud.com/m/1000413178/ #RocketMQ #AI #CloudNative

19:04 Alibaba Cloud @ alibaba_cloud 精选 62 智能体 MCP/工具 产品更新 推荐理由: RocketMQ一直是个"安静干活"的消息中间件,这波专门为AI工作流做的改造,对在做多agent系统的开发者是个实用的基础设施更新,开源可以白嫖。

智能体 MCP/工具 产品更新
AI HOT ·

Anthropic 已正式提交上市申请

01:08 The Verge:AI(RSS) 精选 85 人工智能公司 Anthropic 已向美国证券交易委员会秘密提交了 S-1 拍草注册声明,启动首次公开募股流程。根据其最近一轮融资,该公司目前估值为 9650 亿美元,成为全球最有价值的初创公司,超过了主要竞争对手 OpenAI 8520 亿美元的估值。 Anthropic 行业动态 推荐理由: Anthropic抢在OpenAI前秘密提交IPO申请,9650亿美元估值不仅压过对手一头,更是把AI竞赛从实验室直接拽到了华尔街,这轮上市会重新定义整个行业的估值锚。 00:38 Hugging Face:Blog(RSS) 精选 63 介绍 Mellum2:JetBrains 推出的 12B 混合专家模型 JetBrains 在 Hugging Face 发布博客,介绍其新发布的 Mellum2 模型。该模型采用混合专家架构,参数规模为 12B。 开源生态 模型发布 编码 推荐理由: JetBrains 的第一个自研模型,12B MoE 参数很小但主打代码场景,有意思的点在于它可能被直接集成进 IDE,做本地代码补全。开源且轻量,适合玩本地推理的开发者看一眼,但对大模型格局影响有限。 00:35 Tomer Tunguz 博客(VC 分析) 精选 62 AI看跌情绪地图 金融市场对AI的看跌情绪正从整体上升转向板块分化。上季度,软件、半导体、云及超大规模公司的空头比例中位数上升约24%。GPU数据中心业务空头股份在过去一年激增60%。AI云与新型云公司的当前空头比例中位数最高,达16.8%,SaaS与开发工具领域随后,分别为9.5%和8.9%。相比之下,超大规模公司和NVIDIA的空头比例极低,仅为1.1%和1.2%。市场怀疑主要针对那些AI业务仍依赖未来资本、需求或运营杠杆的中小型公司。 现象/趋势 推荐理由: 这份AI做空地图把市场怀疑论的矛头指向了谁说得明明白白,GPU云和AI SaaS被看空得最狠,但NVIDIA和超大规模云商几乎没被碰,做投资或者关心谁在裸泳的可以认真看看。 00:26 Google Gemini @ GeminiApp 精选 71 轻松将自己添加到Gemini的视频创作中。 以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵 Google 图像生成 教程/实践 视频 关联讨论 1 条 X:Berry Xia (@berryxia) 推荐理由: 官方给了个傻瓜教程,看一遍就能在视频里塞进自己的数字分身,做短视频和教学的可以省掉真人出镜的麻烦。 00:25 OpenRouter @ OpenRouter 精选 77 Auto Router 现在允许你调整其在成本与质量之间的权衡。 新增 `cost_quality_tradeoff` 参数,范围 0 到

Anthropic 行业动态 开源生态 模型发布 编码 现象/趋势 Google 图像生成 教程/实践 视频 产品更新 部署/工程
AI HOT ·

使用NVIDIA Cosmos 3开发物理AI推理、世界与行动模型

13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 71 NVIDIA Cosmos 3是一款面向物理AI的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。 具身智能 推理 模型发布 关联讨论 6 条 NVIDIA Blog:Generative AI(网页) X:NVIDIA AI (@NVIDIAAI) NVIDIA Blog:Agentic AI(网页) Hugging Face:Blog(RSS) IT之家(RSS) X:Kim (@kimmonismus) 推荐理由: Cosmos 3 的发布意味着物理 AI 模型从单点能力走向整合,NVIDIA 显然想在机器人时代提供基础设施,虽然刚发布还摸不着,但方向已足够清晰。

具身智能 推理 模型发布
AI HOT ·

NVIDIA Vera CPU 为AI工厂的智能体工作负载设立新标准

13:00 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 55 NVIDIA Vera CPU 旨在为AI工厂中智能体工作负载树立新性能标杆。文章阐述了AI领域扩展规律的演变:预训练通过更大数据集、更多参数和大规模并行GPU系统扩展智能;后训练通过指令微调扩展实用性,并重新调整GPU用于生成式推理;测试时缩放则通过给模型更多生成token来提升推理能力。当前,智能体AI与强化学习正推动下一阶段的扩展。 智能体 产品更新 部署/工程 关联讨论 1 条 NVIDIA Blog:Agentic AI(网页) 推荐理由: Vera CPU 是 NVIDIA 为 Agent 时代定制的算力底座,把高吞吐和能效揉在一起,做 AI infra 的值得细看它的互联设计。

智能体 产品更新 部署/工程
AI HOT ·

介绍Cosmos Coalition

13:24 Runway:News(网页) 精选 64 Runway宣布作为创始成员加入Cosmos Coalition,该联盟与NVIDIA及多家领先AI实验室合作,旨在构建并开源面向物理AI的前沿世界模型。首个项目将由Runway与NVIDIA共同开发一个基础模型,以推动下一代开放世界模型的研究与发展。 开源生态 行业动态 关联讨论 1 条 X:Runway (@runwayml) 推荐理由: Runway 和 NVIDIA 牵头组建 Cosmos Coalition,直接瞄准开源世界模型。这个方向如果真跑通,物理 AI 的进度会被大幅拉快,但关键是开源承诺和后续生态能不能跟上。

开源生态 行业动态
AI HOT ·

NVIDIA 发布 RTX Spark 及本地 AI 智能体安全与性能更新

13:47 NVIDIA Blog:Agentic AI(网页) 精选 69 NVIDIA 发布了 RTX Spark,一款专为本地 AI 智能体设计的 Windows 电脑,提供 1 petaflops AI 算力与 128GB 统一内存。其推出的 OpenShell 运行时与微软合作,基于新的 Windows 安全原语,确保智能体在设备端安全私密运行。性能方面,通过在 llama.cpp 中采用多 token 预测等优化,Qwen 3.6 和 3.5 27B 模型推理吞吐量提升最高达 2 倍,35B 模型提升 1.6 倍;多 GPU 优化使 llama.cpp 和 ComfyUI 获得最高 2 倍性能提升。此外,Adobe、Blender 等应用也进行了更新。 智能体 Microsoft 产品更新 端侧 关联讨论 5 条 Bloomberg:Technology(RSS) X:NVIDIA (@nvidia) NVIDIA Blog:Generative AI(网页) X:NVIDIA RTX Spark (@NVIDIARTXSpark) X:卡兹克 (@Khazix0918) 推荐理由: NVIDIA 直接把 PC 从工具变成能跑本地 Agent 的「队友」,和微软从系统层联手锁死安全,llama.cpp 推理吞吐翻倍,今年秋天本地 Agent 生态真要烧起来了。

智能体 Microsoft 产品更新 端侧