AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

ICYMI:Nano Banana Pro 【gemini-3-pro-image】 和 Nano Banana 2 【gemini-3.1-flash-image】 现已正式发布,可通过 Gemini API 投入生产使用。 查看这些优秀的社区示例,了解两个模型的实际能力 🧵

19:45 Google AI Developers @ googleaidevs 精选 71 Google 图像生成 模型发布 推荐理由: Gemini 图像模型 GA 了,生成式视觉正式进入 Google 时间,做设计工具和内容生成的开发者可以直接接入测试,看看能不能成为下一个 Midjourney。

Google 图像生成 模型发布
AI HOT ·

DeepSeek V4 Flash 现已在 OpenCode Zen 上线。

02:59 OpenCode @ opencode 精选 63 DeepSeek 产品更新 编码 推荐理由: DeepSeek V4 Flash 火速上岸 OpenCode Zen,想尝鲜的开发者现在就能在编辑器里直接调用,动作快得有点不像开源生态的节奏。

DeepSeek 产品更新 编码
AI HOT ·

MiniMax M3即将发布 你现在就可以在OpenCode中免费试用

08:07 OpenCode @ opencode 精选 63 推理 模型发布 关联讨论 2 条 IT之家(RSS) X:MiniMax (@MiniMax_AI) 推荐理由: MiniMax的M3在OpenCode偷偷上了免费试用,虽然没正式发布,但做中文生成的同学现在就能上手摸,是骡子是马先遛一圈。

推理 模型发布
AI HOT ·

小即是美。😌

19:11 StepFun @ StepFun_ai 精选 62 Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 - ∞) : I've been waiting for this! They managed to do it before June, and they open sourced it right away! @antirez I've been s... 多模态 开源/仓库 模型发布 端侧 推荐理由: StepFun 赶在六月前发了一款小参数开源多模态模型,比 V4-Flash 还小还快,直接开源,做端侧和快速集成的值得立刻拉下来试试。

多模态 开源/仓库 模型发布 端侧
AI HOT ·

最后一次技术面试

15:41 Hacker News 热门(buzzing.cc 中文翻译) 精选 71 Steve Yegge 在 Medium 发表观点文章《最后一次技术面试》,探讨 AI 时代传统技术面试的意义变化。文章在 Hacker News 社区获得 100 分关注。 大佬观点 编码 推荐理由: Steve Yegge 用他一贯犀利的文笔预言技术面试的终结,这不是危言耸听,而是给所有还在刷 LeetCode 的开发者提前拉响的警报。

大佬观点 编码
AI HOT ·

突发新闻:JAX NVIDIA GPU & XLA:GPU最大客户刚刚宣布已放弃JAX GPU,宁愿用Grok Build"氛围编程"一个C训练框架。据报道xAI的JAX堆栈MFU低于10%。NVIDIA JAX团队过去两年全部主力996专注于支持xAI却失败了,我想他们现在可以休息并兑现期权了。

12:18 SemiAnalysis @ SemiAnalysis_ 精选 76 xAI 开源生态 行业动态 推荐理由: xAI 这个 GPU 最大客户突然甩了 JAX,要自研 C 训练框架,理由是 JAX 利用率太低。如果连万亿参数集群都搞不定,JAX 的底层缺陷可能比想象的大,做大规模训练的团队得认真评估了。

xAI 开源生态 行业动态
AI HOT ·

现在你可以直接在ComfyUI工作流中使用你的OpenRouter模型了! 【引用 @ComfyUI】:ComfyUI刚刚添加了@OpenRouter支持。 你不再局限于单一的大语言模型,现在可以直接在Comfy中访问20多个模型。 更多灵活性,更少摩擦,同样的工作流。 工作流链接在下方👇

08:06 OpenRouter @ OpenRouter 精选 72 ComfyUI : ComfyUI just added @OpenRouter support. Instead of being locked into a single LLM, you can now access 20+ models directl... 产品更新 多模态 开源生态 推荐理由: ComfyUI 首次直接集成 LLM 路由服务,等于给图像管线加了个「外挂大脑」,做自动化工作流的人可以直接在节点里调用 20+ 模型,省掉一堆 API tinker 环节。

产品更新 多模态 开源生态
AI HOT ·

阿里云和Qwen成为UEFA官方独家AI、云计算与电子商务合作伙伴,合作期覆盖2027/2028赛季至2032/2033赛季的UEFA男子俱乐部赛事,以及UEFA EURO 2028。阿里巴巴集团主席蔡崇信表示,将投入云计算、全栈AI及全球电商平台能力,支持赛事运营。合作将利用Qwen大语言模型部署先进AI技术,增强球迷互动与媒体内容体验,并依托阿里云基础设施打造全球沉浸式观赛体验。

08:44 Alibaba Cloud @ alibaba_cloud 精选 64 Alibaba Group : Alibaba will become the official and exclusive partner for AI, Cloud Computing Services, and E-commerce of the UEFA Cham... 行业动态 推荐理由: 典型的体育赞助×AI合作,主要看点是阿里云拿下UEFA的长期独家,但AI部分更像PR包装,对技术圈来说可看可不看。

行业动态
AI HOT ·

Show HN: Tiny-vLLM--基于 C 和 CUDA 的高性能大型语言模型推理引擎

11:41 Hacker News 热门(buzzing.cc 中文翻译) 精选 70 Tiny-vLLM 是一个用 C 和 CUDA 编写的高性能大语言模型推理引擎,项目代码已开源至 GitHub。 开源/仓库 推理 部署/工程 推荐理由: 如果你觉得 vLLM 太重,这个用 C 和 CUDA 从头写的推理引擎简直是清流,部署成本骤降,做本地推理的可以马上 clone 试试。

开源/仓库 推理 部署/工程
AI HOT ·

Codex用于管理Codex界面: 【引用 @guinnesschen】:如果你厌倦了管理Codex对话线程,就让Codex自己管理自己吧!Codex现在可以创建对话线程、搜索它们、整理它们、固定重要的线程,并为并行任务启动工作树。

06:49 Greg Brockman @ gdb 精选 75 Guinness Chen : If you ever get tired of managing your Codex threads, just let Codex manage itself! Codex can now create threads, search... OpenAI 产品更新 编码 推荐理由: Codex 能自己管理线程、搜索、组织了,长期在终端里干活的开发者会明显减少上下文切换,这是把 AI 助手往主动管理推了一步。

OpenAI 产品更新 编码
AI HOT ·

Guardrails:保护你的智能体、数据与成本

07:19 OpenRouter:Announcements(RSS) 精选 73 Guardrails 是一套可配置的安全与治理工具,提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能,旨在保护智能体(Agents)、数据与控制成本。 智能体 产品更新 安全/对齐 推荐理由: 给 agent 加安全护栏这件事,OpenRouter 把它做进了控制台,预算限制、防注入、数据不落盘都能开箱即用,做生产级 agent 的可以少写一堆胶水代码。

智能体 产品更新 安全/对齐
AI HOT ·

claude-design-card 是一款专为中文内容创作者设计的 Skill。它能将文字、URL 或文章直接转化为可发布的视觉卡片,如公众号首图、小红书图文卡、教程步骤卡等,支持 28 种布局与 10 种主题。其核心价值在于自动化了"写完文章"后最繁琐的流程:自动提炼重点、选择版式、生成 HTML 并截图成 PNG,替代了以往手动使用 Figma 或 Canva 等工具的步骤。该工具开源,适合经常撰写相关内容的创作者尝试。

06:42 ginobefun @ hongming731 精选 78 撸毛吃猪脚饭 : 昨天那个 md2wechat-skill 很多人收藏 今天再分享一个很适合中文创作者的 Skill:claude-design-card。 它可以把一段文字、一个 URL、一篇文章,直接生成能发出去的视觉卡片,比如公众号首图、小红书图文卡、... GitHub 图像生成 开源/仓库 推荐理由: 这个 Skill 把内容创作者最烦的「写文→排卡片→出图」流程直接打通了,28 种布局一键生成,做公众号和小红书的可以立刻收藏,关键不是好看是真省时间。

GitHub 图像生成 开源/仓库
AI HOT ·

DynoSim:模拟帕累托前沿

06:31 NVIDIA Technical Blog(开发者技术博客 · RSS) 精选 63 现代大语言模型服务难以调优,因为每个部署都涉及模型后端、张量并行形状、预填充/解码分割、Worker数量、调度器设置、路由策略、KV缓存行为、自动扩展阈值和拓扑等相互关联的选择。这些选择在多个层级相互作用,局部优化可能导致瓶颈转移至其他环节。 推理 教程/实践 部署/工程 推荐理由: LLM 部署调优一直靠玄学试错,NVIDIA 这个 DynoSim 总算把 Pareto 前沿模拟成了直观工具,做推理服务的工程师可以省下大量调参时间。

推理 教程/实践 部署/工程
AI HOT ·

OpenAI 实时翻译功能--使用70多种输入语言说话,翻译成13种输出语言: gpt-realtime-translate 接收任意语言的语音输入,并输出目标语言的语音。 大语言模型很棒,但特定用例需要专用模型。 我们正在智能眼镜上运行此功能。

04:19 Greg Brockman @ gdb 精选 76 cayden 凯登 : OpenAI just dropped a completely new kind of model gpt-realtime-translate takes in speech audio from any language and ou... OpenAI 多模态 模型发布 语音 推荐理由: OpenAI悄悄推出一个专门做实时语音翻译的模型,不是通用LLM,而是专用模型。这标志着AI交互从文字转向语音的第一步,做翻译硬件或AR眼镜的团队要睡不着了。

OpenAI 多模态 模型发布 语音
AI HOT ·

我们持续为 Runway API 添加新模型和端点,以便您能将最佳生成能力直接集成到应用、产品和平台中。通过 Runway API,您可以在一个地方获得所需的所有模型,包括 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro、Magnific Precision Upscaler V2 等更多内容。请通过下方链接开始使用。

04:10 Runway @ runwayml 精选 72 产品更新 图像生成 推荐理由: Runway API 这次集中上新,Seedance 2.0 加入虽然方便了开发者,但没有模型能力的质变,更像是生态补全。

产品更新 图像生成
AI HOT ·

参与我们的 I/O 2026 测验:该测验由 Google AI Studio 氛围编程生成

03:08 Google Blog:AI(RSS) 精选 55 Google 使用其开发工具 Google AI Studio,通过氛围编程(vibe coding)方式,创建了一个关于 Google I/O 2026 主要公告的在线测验。 Google 教程/实践 推荐理由: Google 用 AI Studio 自己 vibe code 了个 I/O 测验,是想展示普通人也玩得转,但 quiz 本身信息量不大,想体验 vibe coding 的可以顺手玩玩。

Google 教程/实践
AI HOT ·

LlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,使智能体能够访问 LlamaParse 和 LiteParse,从而自动处理非结构化文档。其工作流程为:配置数据与输出的 Git 仓库,将仓库克隆至智能体沙箱,安装 LiteParse CLI 与 LlamaParse SDK 及相关技能,最后通过提示词驱动智能体自主执行任务。该模板最终形成一个可直接使用 LlamaParse 和 LiteParse 处理真实世界文档的智能体。

03:45 Google AI Developers @ googleaidevs 精选 63 LlamaIndex 🦙 : 🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed... 智能体 Google MCP/工具 教程/实践 推荐理由: Google 的 Agents API 才发布没多久,LlamaIndex 就火速提供了把 LlamaParse 接进去的完整模板,想尝试在沙箱里跑文档处理 agent 的开发者可以直接抄作业。

智能体 Google MCP/工具 教程/实践
AI HOT ·

Gemini Omni甚至能将简单的草图变为新的现实。 在Gemini应用中亲自尝试。上传一段有人画圆的视频,然后输入这个提示词:当我画完这个圆时,它变成了___。

03:06 Google Gemini @ GeminiApp 精选 74 Google 产品更新 多模态 关联讨论 1 条 X:Gemini (@GeminiApp) 推荐理由: Google 把「画个圈然后说变什么」做成了真功能,创意交互的门槛又低了,普通用户随手就能玩,但本质是锦上添花,不是核心能力跃迁。

Google 产品更新 多模态