AI and technology watch

AI 快讯

聚合 24 小时内的人工智能与开发者生态动态,保留来源链接方便继续阅读。

---
AI HOT ·

现在你可以直接在ComfyUI工作流中使用你的OpenRouter模型了! 【引用 @ComfyUI】:ComfyUI刚刚添加了@OpenRouter支持。 你不再局限于单一的大语言模型,现在可以直接在Comfy中访问20多个模型。 更多灵活性,更少摩擦,同样的工作流。 工作流链接在下方👇

08:06 OpenRouter @ OpenRouter 精选 72 ComfyUI : ComfyUI just added @OpenRouter support. Instead of being locked into a single LLM, you can now access 20+ models directl... 产品更新 多模态 开源生态 推荐理由: ComfyUI 首次直接集成 LLM 路由服务,等于给图像管线加了个「外挂大脑」,做自动化工作流的人可以直接在节点里调用 20+ 模型,省掉一堆 API tinker 环节。

产品更新 多模态 开源生态
AI HOT ·

阿里云和Qwen成为UEFA官方独家AI、云计算与电子商务合作伙伴,合作期覆盖2027/2028赛季至2032/2033赛季的UEFA男子俱乐部赛事,以及UEFA EURO 2028。阿里巴巴集团主席蔡崇信表示,将投入云计算、全栈AI及全球电商平台能力,支持赛事运营。合作将利用Qwen大语言模型部署先进AI技术,增强球迷互动与媒体内容体验,并依托阿里云基础设施打造全球沉浸式观赛体验。

08:44 Alibaba Cloud @ alibaba_cloud 精选 64 Alibaba Group : Alibaba will become the official and exclusive partner for AI, Cloud Computing Services, and E-commerce of the UEFA Cham... 行业动态 推荐理由: 典型的体育赞助×AI合作,主要看点是阿里云拿下UEFA的长期独家,但AI部分更像PR包装,对技术圈来说可看可不看。

行业动态
AI HOT ·

Show HN: Tiny-vLLM--基于 C 和 CUDA 的高性能大型语言模型推理引擎

11:41 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 Tiny-vLLM 是一个用 C 和 CUDA 编写的高性能大语言模型推理引擎,项目代码已开源至 GitHub。 开源/仓库 推理 部署/工程 推荐理由: 如果你觉得 vLLM 太重,这个用 C 和 CUDA 从头写的推理引擎简直是清流,部署成本骤降,做本地推理的可以马上 clone 试试。

开源/仓库 推理 部署/工程
AI HOT ·

Codex用于管理Codex界面: 【引用 @guinnesschen】:如果你厌倦了管理Codex对话线程,就让Codex自己管理自己吧!Codex现在可以创建对话线程、搜索它们、整理它们、固定重要的线程,并为并行任务启动工作树。

06:49 Greg Brockman @ gdb 精选 75 Guinness Chen : If you ever get tired of managing your Codex threads, just let Codex manage itself! Codex can now create threads, search... OpenAI 产品更新 编码 推荐理由: Codex 能自己管理线程、搜索、组织了,长期在终端里干活的开发者会明显减少上下文切换,这是把 AI 助手往主动管理推了一步。

OpenAI 产品更新 编码
AI HOT ·

Guardrails:保护你的智能体、数据与成本

07:19 OpenRouter:Announcements(RSS) 精选 73 Guardrails 是一套可配置的安全与治理工具,提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能,旨在保护智能体(Agents)、数据与控制成本。 智能体 产品更新 安全/对齐 推荐理由: 给 agent 加安全护栏这件事,OpenRouter 把它做进了控制台,预算限制、防注入、数据不落盘都能开箱即用,做生产级 agent 的可以少写一堆胶水代码。

智能体 产品更新 安全/对齐
AI HOT ·

claude-design-card 是一款专为中文内容创作者设计的 Skill。它能将文字、URL 或文章直接转化为可发布的视觉卡片,如公众号首图、小红书图文卡、教程步骤卡等,支持 28 种布局与 10 种主题。其核心价值在于自动化了"写完文章"后最繁琐的流程:自动提炼重点、选择版式、生成 HTML 并截图成 PNG,替代了以往手动使用 Figma 或 Canva 等工具的步骤。该工具开源,适合经常撰写相关内容的创作者尝试。

06:42 ginobefun @ hongming731 精选 78 撸毛吃猪脚饭 : 昨天那个 md2wechat-skill 很多人收藏 今天再分享一个很适合中文创作者的 Skill:claude-design-card。 它可以把一段文字、一个 URL、一篇文章,直接生成能发出去的视觉卡片,比如公众号首图、小红书图文卡、... GitHub 图像生成 开源/仓库 推荐理由: 这个 Skill 把内容创作者最烦的「写文→排卡片→出图」流程直接打通了,28 种布局一键生成,做公众号和小红书的可以立刻收藏,关键不是好看是真省时间。

GitHub 图像生成 开源/仓库
AI HOT ·

DynoSim:模拟帕累托前沿

06:31 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 63 现代大语言模型服务难以调优,因为每个部署都涉及模型后端、张量并行形状、预填充/解码分割、Worker数量、调度器设置、路由策略、KV缓存行为、自动扩展阈值和拓扑等相互关联的选择。这些选择在多个层级相互作用,局部优化可能导致瓶颈转移至其他环节。 推理 教程/实践 部署/工程 推荐理由: LLM 部署调优一直靠玄学试错,NVIDIA 这个 DynoSim 总算把 Pareto 前沿模拟成了直观工具,做推理服务的工程师可以省下大量调参时间。

推理 教程/实践 部署/工程
AI HOT ·

OpenAI 实时翻译功能--使用70多种输入语言说话,翻译成13种输出语言: gpt-realtime-translate 接收任意语言的语音输入,并输出目标语言的语音。 大语言模型很棒,但特定用例需要专用模型。 我们正在智能眼镜上运行此功能。

04:19 Greg Brockman @ gdb 精选 76 cayden 凯登 : OpenAI just dropped a completely new kind of model gpt-realtime-translate takes in speech audio from any language and ou... OpenAI 多模态 模型发布 语音 推荐理由: OpenAI悄悄推出一个专门做实时语音翻译的模型,不是通用LLM,而是专用模型。这标志着AI交互从文字转向语音的第一步,做翻译硬件或AR眼镜的团队要睡不着了。

OpenAI 多模态 模型发布 语音
AI HOT ·

我们持续为 Runway API 添加新模型和端点,以便您能将最佳生成能力直接集成到应用、产品和平台中。通过 Runway API,您可以在一个地方获得所需的所有模型,包括 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro、Magnific Precision Upscaler V2 等更多内容。请通过下方链接开始使用。

04:10 Runway @ runwayml 精选 72 产品更新 图像生成 推荐理由: Runway API 这次集中上新,Seedance 2.0 加入虽然方便了开发者,但没有模型能力的质变,更像是生态补全。

产品更新 图像生成
AI HOT ·

参与我们的 I/O 2026 测验:该测验由 Google AI Studio 氛围编程生成

03:08 Google Blog:AI(RSS) 精选 55 Google 使用其开发工具 Google AI Studio,通过氛围编程(vibe coding)方式,创建了一个关于 Google I/O 2026 主要公告的在线测验。 Google 教程/实践 推荐理由: Google 用 AI Studio 自己 vibe code 了个 I/O 测验,是想展示普通人也玩得转,但 quiz 本身信息量不大,想体验 vibe coding 的可以顺手玩玩。

Google 教程/实践
AI HOT ·

LlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,使智能体能够访问 LlamaParse 和 LiteParse,从而自动处理非结构化文档。其工作流程为:配置数据与输出的 Git 仓库,将仓库克隆至智能体沙箱,安装 LiteParse CLI 与 LlamaParse SDK 及相关技能,最后通过提示词驱动智能体自主执行任务。该模板最终形成一个可直接使用 LlamaParse 和 LiteParse 处理真实世界文档的智能体。

03:45 Google AI Developers @ googleaidevs 精选 63 LlamaIndex 🦙 : 🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed... 智能体 Google MCP/工具 教程/实践 推荐理由: Google 的 Agents API 才发布没多久,LlamaIndex 就火速提供了把 LlamaParse 接进去的完整模板,想尝试在沙箱里跑文档处理 agent 的开发者可以直接抄作业。

智能体 Google MCP/工具 教程/实践
AI HOT ·

Gemini Omni甚至能将简单的草图变为新的现实。 在Gemini应用中亲自尝试。上传一段有人画圆的视频,然后输入这个提示词:当我画完这个圆时,它变成了___。

03:06 Google Gemini @ GeminiApp 精选 74 Google 产品更新 多模态 关联讨论 1 条 X:Gemini (@GeminiApp) 推荐理由: Google 把「画个圈然后说变什么」做成了真功能,创意交互的门槛又低了,普通用户随手就能玩,但本质是锦上添花,不是核心能力跃迁。

Google 产品更新 多模态
AI HOT ·

Braintrust如何用Codex将客户请求转化为代码

02:52 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 64 Braintrust的工程师正在使用Codex结合GPT-5.5模型,以加速其实验运行与代码编写的流程。 智能体 OpenAI 教程/实践 编码 推荐理由: 真正的工程团队实操,不是 PPT 演示,如果你想了解 Codex 在生产环境中的落地效果,这篇比任何评测都实在。

智能体 OpenAI 教程/实践 编码
AI HOT ·

当公司过于"AI上瘾"时会发生什么?

02:15 TechCrunch:AI(RSS) 精选 72 Box创始人Aaron Levie指出,决定用AI替代员工的人往往最不了解工作的实际内容,他将此称为“AI psychosis”。ClickUp近期为部署AI智能体裁员22%即是一例。2026年的科技行业裁员规模已接近2025年全年。 现象/趋势 行业动态 推荐理由: Aaron Levie 造了个好词“AI psychosis”,用来形容那些并不懂你工作却要裁掉你的管理层,这两年科技公司裁员潮背后的荒诞逻辑被点透了。

现象/趋势 行业动态
AI HOT ·

Windows用户,这条消息是给你的。 计算机使用功能现已在Windows上可用,因此Codex可以在你的Windows电脑上执行操作。 通过ChatGPT移动应用中Codex的Windows支持,你可以在工作继续在Windows电脑上进行时,随时随地启动、审查和引导任务。 这是一项早期体验,但我们正在努力提供更多方式,让你的工作无论身在何处都能持续进行。

02:38 OpenAI @ OpenAI 精选 73 智能体 MCP/工具 OpenAI 产品更新 关联讨论 3 条 IT之家(RSS) X:Berry Xia (@berryxia) X:OpenAI Developers (@OpenAIDevs) 推荐理由: Windows 用户终于等到 Codex 能直接操控电脑了,配合手机端协同一气呵成,虽然还早期,但已经把 AI 真正带进日常工作流里。

智能体 MCP/工具 OpenAI 产品更新
AI HOT ·

我对这个适用于大规模生成模型新时代的视觉生成基准数据集感到非常兴奋!🤩

01:14 Fei-Fei Li @ drfeifei 精选 79 Keshigeyan Chandrasegaran : 1/ Introducing GPIC: a Giant Permissive Image Corpus and benchmark for visual generation! 🚀100M VLM-captioned image-tex... Hugging Face 图像生成 数据/训练 论文/研究 推荐理由: 李飞飞都来站台,这个数据集不简单。完全允许商业用途是关键,对做视觉生成的团队来说,终于有了一个不用再为版权头疼的超级训练库。

Hugging Face 图像生成 数据/训练 论文/研究
AI HOT ·

亲测为实:难以置信的推理速度

01:15 Rohan Paul @ rohanpaul_ai 精选 76 Kog团队在标准数据中心GPU上实现了极高的单用户推理速度,在8× AMD MI300X GPUs上达到3,000 tokens/s,在8× NVIDIA H200上达到2,100 tokens/s。相比常规推理速度(约100-300 tokens/s),实现了10-30倍提升。其核心思路是将LLM解码视为内存流问题,通过协同设计monokernel、重建同步机制、针对性内存访问映射及采用延迟张量并行的Laneformer模型架构,消除了传统流程的阻塞点。 大佬观点 推理 部署/工程 推荐理由: Rohan亲自测完Kog AI的3000 token/s,把单用户推理速度拉高了10-30倍,这套monokernel设计可能改写低延迟推理的玩法,做实时AI产品的团队必须盯紧。

大佬观点 推理 部署/工程
AI HOT ·

可信第三方评估的共享操作手册

01:07 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 56 OpenAI 发布了一份关于第三方 AI 评估的指导框架,内容涵盖如何评估前沿系统的能力、安全防护措施及评估本身的有效性。 OpenAI 安全/对齐 教程/实践 评测/基准 推荐理由: OpenAI 首次把模型评估的方法论打包共享,这份指南是给第三方评估者的操作手册,比零散的论文更落地,做评测的团队可以直接抄作业。

OpenAI 安全/对齐 教程/实践 评测/基准