AI HOT
·
2026-05-31 03:21
04:19 Greg Brockman @ gdb 精选 76 cayden 凯登 : OpenAI just dropped a completely new kind of model gpt-realtime-translate takes in speech audio from any language and ou... OpenAI 多模态 模型发布 语音 推荐理由: OpenAI悄悄推出一个专门做实时语音翻译的模型,不是通用LLM,而是专用模型。这标志着AI交互从文字转向语音的第一步,做翻译硬件或AR眼镜的团队要睡不着了。
OpenAI
多模态
模型发布
语音
AI HOT
·
2026-05-31 02:14
04:10 Runway @ runwayml 精选 72 产品更新 图像生成 推荐理由: Runway API 这次集中上新,Seedance 2.0 加入虽然方便了开发者,但没有模型能力的质变,更像是生态补全。
产品更新
图像生成
AI HOT
·
2026-05-31 00:00
03:08 Google Blog:AI(RSS) 精选 55 Google 使用其开发工具 Google AI Studio,通过氛围编程(vibe coding)方式,创建了一个关于 Google I/O 2026 主要公告的在线测验。 Google 教程/实践 推荐理由: Google 用 AI Studio 自己 vibe code 了个 I/O 测验,是想展示普通人也玩得转,但 quiz 本身信息量不大,想体验 vibe coding 的可以顺手玩玩。
Google
教程/实践
AI HOT
·
2026-05-31 00:00
03:45 Google AI Developers @ googleaidevs 精选 63 LlamaIndex 🦙 : 🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed... 智能体 Google MCP/工具 教程/实践 推荐理由: Google 的 Agents API 才发布没多久,LlamaIndex 就火速提供了把 LlamaParse 接进去的完整模板,想尝试在沙箱里跑文档处理 agent 的开发者可以直接抄作业。
智能体
Google
MCP/工具
教程/实践
AI HOT
·
2026-05-30 23:25
03:06 Google Gemini @ GeminiApp 精选 74 Google 产品更新 多模态 关联讨论 1 条 X:Gemini (@GeminiApp) 推荐理由: Google 把「画个圈然后说变什么」做成了真功能,创意交互的门槛又低了,普通用户随手就能玩,但本质是锦上添花,不是核心能力跃迁。
Google
产品更新
多模态
AI HOT
·
2026-05-30 21:14
02:52 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 64 Braintrust的工程师正在使用Codex结合GPT-5.5模型,以加速其实验运行与代码编写的流程。 智能体 OpenAI 教程/实践 编码 推荐理由: 真正的工程团队实操,不是 PPT 演示,如果你想了解 Codex 在生产环境中的落地效果,这篇比任何评测都实在。
智能体
OpenAI
教程/实践
编码
AI HOT
·
2026-05-30 20:10
02:15 TechCrunch:AI(RSS) 精选 72 Box创始人Aaron Levie指出,决定用AI替代员工的人往往最不了解工作的实际内容,他将此称为“AI psychosis”。ClickUp近期为部署AI智能体裁员22%即是一例。2026年的科技行业裁员规模已接近2025年全年。 现象/趋势 行业动态 推荐理由: Aaron Levie 造了个好词“AI psychosis”,用来形容那些并不懂你工作却要裁掉你的管理层,这两年科技公司裁员潮背后的荒诞逻辑被点透了。
现象/趋势
行业动态
AI HOT
·
2026-05-30 20:10
02:38 OpenAI @ OpenAI 精选 73 智能体 MCP/工具 OpenAI 产品更新 关联讨论 3 条 IT之家(RSS) X:Berry Xia (@berryxia) X:OpenAI Developers (@OpenAIDevs) 推荐理由: Windows 用户终于等到 Codex 能直接操控电脑了,配合手机端协同一气呵成,虽然还早期,但已经把 AI 真正带进日常工作流里。
智能体
MCP/工具
OpenAI
产品更新
AI HOT
·
2026-05-30 19:03
01:14 Fei-Fei Li @ drfeifei 精选 79 Keshigeyan Chandrasegaran : 1/ Introducing GPIC: a Giant Permissive Image Corpus and benchmark for visual generation! 🚀100M VLM-captioned image-tex... Hugging Face 图像生成 数据/训练 论文/研究 推荐理由: 李飞飞都来站台,这个数据集不简单。完全允许商业用途是关键,对做视觉生成的团队来说,终于有了一个不用再为版权头疼的超级训练库。
Hugging Face
图像生成
数据/训练
论文/研究
AI HOT
·
2026-05-30 19:03
01:15 Rohan Paul @ rohanpaul_ai 精选 76 Kog团队在标准数据中心GPU上实现了极高的单用户推理速度,在8× AMD MI300X GPUs上达到3,000 tokens/s,在8× NVIDIA H200上达到2,100 tokens/s。相比常规推理速度(约100-300 tokens/s),实现了10-30倍提升。其核心思路是将LLM解码视为内存流问题,通过协同设计monokernel、重建同步机制、针对性内存访问映射及采用延迟张量并行的Laneformer模型架构,消除了传统流程的阻塞点。 大佬观点 推理 部署/工程 推荐理由: Rohan亲自测完Kog AI的3000 token/s,把单用户推理速度拉高了10-30倍,这套monokernel设计可能改写低延迟推理的玩法,做实时AI产品的团队必须盯紧。
大佬观点
推理
部署/工程
AI HOT
·
2026-05-30 15:26
01:07 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 56 OpenAI 发布了一份关于第三方 AI 评估的指导框架,内容涵盖如何评估前沿系统的能力、安全防护措施及评估本身的有效性。 OpenAI 安全/对齐 教程/实践 评测/基准 推荐理由: OpenAI 首次把模型评估的方法论打包共享,这份指南是给第三方评估者的操作手册,比零散的论文更落地,做评测的团队可以直接抄作业。
OpenAI
安全/对齐
教程/实践
评测/基准
AI HOT
·
2026-05-30 12:00
00:36 Google Gemini @ GeminiApp 精选 63 智能体 Google 产品更新 关联讨论 1 条 X:Gemini (@GeminiApp) 推荐理由: Gemini这次月度更新不是小打小闹,重新设计的体验加上24/7的Spark助手,像是憋了个小改版,用Gemini的人都该看一眼官方到底拿出了什么。
智能体
Google
产品更新
AI HOT
·
2026-05-30 11:37
00:36 OpenRouter @ OpenRouter 精选 72 智能体 MCP/工具 产品更新 编码 推荐理由: OpenRouter 这个 apply_patch 解决了多模型文件编辑的碎片化,任何模型接上就能出 diff,做 coding agent 的可以少写一堆适配代码。
智能体
MCP/工具
产品更新
编码
AI HOT
·
2026-05-30 08:14
00:33 Tomer Tunguz 博客(VC 分析) 精选 65 “技能提炼”是一种知识转移方法,由前沿大模型(如 Opus 4.7、GPT-5.1、Gemini 3 Pro)负责撰写并优化标准化的 SKILL.md 流程文件。然后,本地运行的小模型(如 Qwen 35B、Gemma 26B)直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG,其核心是提取并转移操作流程,让小模型按步骤执行,从而形成前沿模型作教师、小模型作执行者的循环。 智能体 MCP/工具 大佬观点 推荐理由: Tomer 把个人代理的完整工作流摆了出来,用大模型写 skill 小模型执行,这条蒸馏思路比调 prompt 高级,想认真跑本地代理的人该盯一下。
智能体
MCP/工具
大佬观点
AI HOT
·
2026-05-30 07:06
00:15 TechCrunch:AI(RSS) 精选 70 Cognition公司开发了Devvin,这是一个号称首个且最成功的AI编程智能体。其著名程序员创始人Scott Wu明确表示,该智能体并非旨在取代人类程序员。 智能体 大佬观点 编码 推荐理由: Devin 创始人主动说 AI 编码代理不该取代人类,这个表态本身比技术有意思,做开发者工具的产品人该琢磨一下背后的潜台词。
智能体
大佬观点
编码
AI HOT
·
2026-05-30 07:06
00:26 Replit ⠕ @ Replit 精选 62 产品更新 编码 推荐理由: Canvas新功能对Replit用户是实打实的效率提升,但非开发者可以直接跳过,没有看完就用的工具或模型更新。
产品更新
编码
AI HOT
·
2026-05-30 06:00
00:07 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 56 波士顿儿童医院通过部署OpenAI技术,用于改善患者护理并减轻运营负担,成功帮助诊断了超过40种罕见病病例。 OpenAI 行业动态 推荐理由: 波士顿儿童医院用 OpenAI 揪出了 40 多个罕见病,这种 AI 辅助诊断的案例正在从概念验证转向真实落地,医疗 AI 的进度条往前拖了一小格。
OpenAI
行业动态
AI HOT
·
2026-05-30 06:00
00:07 Google AI @ GoogleAI 精选 64 Google 多模态 大佬观点 关联讨论 1 条 X:Jeff Dean (@JeffDean) 推荐理由: Gemini 四大核心人物首次同时出镜,Jeff Dean、Noam Shazeer 这些人平时单拎出来都罕见,一起坐下来聊幕后,是真正能感受这帮人怎么思考模型未来的机会。
Google
多模态
大佬观点
AI HOT
·
2026-05-30 05:39
05:36 Google Gemini @ GeminiApp 精选 69 Google 产品更新 多模态 视频 推荐理由: 我看完这几个例子直呼离谱,从屏幕视频直接生成真实物理运动,Gemini Omni 可能重新定义了多模态交互。做动画和视频的可以冲了。 05:06 ChatGPT @ ChatGPTapp 精选 69 对于每个始于"就问一件事"却演变成完整长篇的ChatGPT对话:目录功能现已推出。 适用于包含5条以上回复的对话。 OpenAI 产品更新 推荐理由: ChatGPT 终于给长对话加了目录,这个功能早该有了。如果你经常跟 ChatGPT 拉扯几十轮,现在可以不用疯狂滚屏了,直接跳转关键节点。 04:55 Luma @ LumaLabsAI 精选 61 博客文章完成了思考。现在让宣传来发挥作用。 输入内容。定义钩子。Luma Agents 从那里构建每一张宣传图。 投入使用 → http://lumalabs.ai/app 产品更新 图像生成 视频 推荐理由: Luma AI 把博客内容自动转成推广视频片段,内容团队又多一个「一键懒人」选项,但成品够不够「可发」还得看实际测试。 04:19 Greg Brockman @ gdb 精选 76 OpenAI 实时翻译功能--使用70多种输入语言说话,翻译成13种输出语言: gpt-realtime-translate 接收任意语言的语音输入,并输出目标语言的语音。 大语言模型很棒,但特定用例需要专用模型。 我们正在智能眼镜上运行此功能。 cayden 凯登 : OpenAI just dropped a completely new kind of model gpt-realtime-translate takes in speech audio from any language and ou... OpenAI 多模态 模型发布 语音 推荐理由: OpenAI悄悄推出一个专门做实时语音翻译的模型,不是通用LLM,而是专用模型。这标志着AI交互从文字转向语音的第一步,做翻译硬件或AR眼镜的团队要睡不着了。 04:10 Runway @ runwayml 精选 72 我们持续为 Runway API 添加新模型和端点,以便您能将最佳生成能力直接集成到应用、产品和平台中。通过 Runway API,您可以在一个地方获得所需的所有模型,包括 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro、Magnific Precision Upscaler V2 等更多内容。请通过下方链接开始使用。 产品更新 图像生成 推荐理由: Runway API 这次集中上新,Seedance 2.0 加入虽然方便了开发者,但没有模型能力的质变,更像是生
Google
产品更新
多模态
视频
OpenAI
图像生成
模型发布
语音
智能体
MCP/工具
教程/实践
编码
现象/趋势
行业动态
大佬观点
推理
部署/工程
Hugging Face
数据/训练
论文/研究
安全/对齐
评测/基准
AI HOT
·
2026-05-30 04:32
23:13 Qwen:Blog Retrieval(API) 精选 74 Qwen Studio提供全面功能,涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网络搜索集成、工具利用及Artifacts。 具身智能 多模态 模型发布 推荐理由: Qwen终于把VLM进化成VLA,从看得懂变成能动手,对做具身智能的团队来说可能是一个新基座,就看动作输出的实际效果了。
具身智能
多模态
模型发布
32 / 65