AI HOT
·
2026-05-28 20:12
18:47 Mistral AI:News(网页) 精选 75 Mistral AI 在 AI Now Summit 2026 上宣布多项进展。其工业 AI 解决方案“Mistral for Industrial Engineering”整合了物理模型与工程知识,正与空客、宝马集团和 ASML 合作,加速工程设计与优化。AI 智能体产品 Vibe 进行了升级,增强了推理和智能体任务能力。此外,公司计划在 2026 年第三季度启用位于 Les Ulis、功率达 10 MW 的新数据中心,专注推理操作以增强算力安全。 智能体 行业动态 关联讨论 2 条 Mistral AI:News(网页) X:Mistral AI (@MistralAI) 推荐理由: Mistral 用一场峰会证明自己不是只会做模型,它把空客、宝马、ASML 拉进战场,工业AI 的落地从PPT变成了产线实操。
智能体
行业动态
AI HOT
·
2026-05-28 20:12
18:47 Mistral AI:News(网页) 精选 64 Mistral AI通过收购Emmi AI,强化其在推动AI研究前沿与工业工程解决方案方面的投入。其目标是为航空航天、汽车、半导体和能源等塑造物理世界的核心产业构建基础性物理AI模型,以加速工程开发。此项研究基于一系列已发表的突破性成果,包括:用于模拟超音速湍流的3D机翼CFD数据集、计算流体动力学基础模型的前瞻综述、应用于汽车与航空的AB-UPT模型,以及用于聚变等离子体湍流模拟的GyroSwin模型。此前已开源的UPT(通用物理Transformer)和NeuralDEM等成果也为此研究奠定了基础。 开源/仓库 论文/研究 关联讨论 1 条 Mistral AI:News(网页) 推荐理由: Mistral 把物理 AI 定为下个重点,从流体仿真到核聚变等离子体都有论文支撑。搞工业仿真的团队值得跟进,但这次没有新模型发布,更多是路线宣示而非新突破。
开源/仓库
论文/研究
AI HOT
·
2026-05-28 19:06
02:57 Midjourney:Updates(RSS) 精选 59 对话模式在文本和语音输入方面进行了改进。语音会话开始时,可访问用户的图像提示、风格参考、侧边栏设置和最近任务。图像提示功能现可从托盘和侧边栏直接使用。在语音提交过程中,托盘中的图像将保持不变,直至用户手动移除。 产品更新 语音 推荐理由: Midjourney给语音模式补了一课——现在它能记住你正在用的图片参考和风格设置,语音创作不用反复翻找,用完即走的轻量用户可能无感。
产品更新
语音
AI HOT
·
2026-05-28 18:00
02:12 OpenCode @ opencode 精选 66 产品更新 多模态 推理 编码 推荐理由: OpenCode突然把MiMo V2.5放出来了,1M上下文加上推理和图片能力,而且免费限时,用AI写代码的朋友可以赶紧试试手气。
产品更新
多模态
推理
编码
AI HOT
·
2026-05-28 18:00
02:42 OpenAI Developers @ OpenAIDevs 精选 70 MCP/工具 OpenAI 产品更新 安全/对齐 推荐理由: OpenAI 终于给企业级 MCP 接上私有网络了,以前要连 ChatGPT 就得把 MCP 暴露公网,现在通过 outbound 隧道就能安全接入,做内部工具开发的可以开始动起来了。
MCP/工具
OpenAI
产品更新
安全/对齐
AI HOT
·
2026-05-28 16:32
02:06 Claude:Blog(网页) 精选 67 Anthropic 发布了针对企业部署自主 AI 智能体的安全框架,指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险:基础设施易受 AI 加速攻击,且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构(基础、高级、优化级)及八阶段实施流程,并概述了提示注入、工具投毒、记忆投毒等特有威胁。 智能体 Anthropic 安全/对齐 教程/实践 推荐理由: 当漏洞利用从数月压缩到数小时,安全架构必须同步进化。这篇框架把零信任落地到Agent场景,八阶段路线图和三级成熟度模型比泛泛的安全声明具体得多,企业安全团队值得细读。
智能体
Anthropic
安全/对齐
教程/实践
AI HOT
·
2026-05-28 15:20
01:43 Replit ⠕ @ Replit 精选 60 编码 行业动态 推荐理由: Redpoint 的 InfraRed 100 榜单把 Replit 和 Stripe、Snowflake 并列,说明 AI 编程工具在基础设施层面已经得到主流认可,但这就是个荣誉,没有实际东西。
编码
行业动态
AI HOT
·
2026-05-28 15:20
02:00 Hao AI Lab @ haoailab 精选 70 GitHub 开源/仓库 视频 部署/工程 推荐理由: 7秒钟出30秒1080p视频,而且完全开源,视频生成速度被拉到实时边缘,虽然B200不是人人有,但路线值得所有做视频产品的同行研究。
GitHub
开源/仓库
视频
部署/工程
AI HOT
·
2026-05-28 14:12
01:41 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 63 在2026年全球选举临近之际,通过帮助公众获取选举信息、支持网络防御者以及提升人工智能透明度这三方面的努力,来为选举提供保障。 OpenAI 安全/对齐 政策/监管 推荐理由: OpenAI 在 2026 全球选举前集中公布防范措施,是头部 AI 公司在信息透明度方面的例行作业,政策观察者可以跟踪一下进展,普通用户不用太在意。
OpenAI
安全/对齐
政策/监管
AI HOT
·
2026-05-28 14:10
14:06 Krea @ krea_ai 精选 64 Replicate : Krea 2 from @krea_ai is available on Replicate. Generate high-fidelity, creative images with aesthetics first in mind. 产品更新 图像生成 部署/工程 推荐理由: Krea 2 的审美一直在线,这次上了 Replicate 变成随时可调的 API,做图像产品的多了一个质量靠谱的选项,值得试试。 12:41 OpenRouter:Announcements(RSS) 精选 72 OpenRouter 获得1.13亿美元B轮融资 AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资。本轮融资由CapitalG领投,NVentures、ServiceNow Ventures等多家机构参投,现有投资者Andreessen Horowitz与Menlo Ventures也参与了本轮融资。 行业动态 部署/工程 推荐理由: OpenRouter 融了 1.13 亿美元,说明模型路由从「小工具」变成正经防线了,开发者选模型不再单一绑定,这个方向钱和战略意义都上来了。 11:36 Alibaba Cloud @ alibaba_cloud 精选 66 🚀 认识 DataWorks Data Agent--阿里云的AI数据智能体! 借助AI简化数据工作流,加速洞察,让数据管理更智能。 了解更多:https://int.alibabacloud.com/m/1000413560/ #AlibabaCloud #DataWorks #AI #DataAgent #BigData #DataAnalytics 智能体 产品更新 推荐理由: 阿里云推出 DataWorks Data Agent,把 AI agent 塞进数据管线,做数据工程的同学可以用更自然的方式管数据了,但怎么定价、跟现有 DataWorks 怎么衔接,还得看细节。 11:28 HuggingFace Daily Papers(社区热门论文) 精选 70 VibeSearchBench:面向真实世界中长期主动搜索的评测基准 基于LLM的智能体在现有搜索基准上表现优异,但真实用户体验不佳,这源于现有基准依赖于高度明确的查询、单轮交互和固定格式评估,无法反映用户与智能体通过多轮对话协同澄清模糊意图的真实搜索行为。为此,研究提出了“VibeSearch”范式并发布了VibeSearchBench,该基准包含200个手工策划的双语任务,覆盖20个领域,分为专业与日常生活两个子集。评估通过用户模拟器和图匹配框架进行。对七个前沿模型的测试显示,所有模型在VibeSearch任务上表现均不充分(最佳F1分数为30.30)
产品更新
图像生成
部署/工程
行业动态
智能体
arXiv
推理
搜索
论文/研究
开源/仓库
编码
大佬观点
端侧
教程/实践
Anthropic
数据/训练
OpenAI
安全/对齐
Meta
MCP/工具
现象/趋势
语音
多模态
GitHub
视频
政策/监管
Google
Hugging Face
评测/基准
xAI
AI HOT
·
2026-05-28 12:00
01:39 Google Developers Blog(RSS) 精选 66 Google Pay 正向"智能体商务"演进,推出了通用商务协议和新的 MCP 服务器,允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账,并通过 WebView 将支付功能扩展至社交媒体应用。此外,平台还推出了跨设备生物认证和新的交易信号,旨在帮助商家减少流程摩擦。 智能体 Google MCP/工具 产品更新 推荐理由: Google Pay 往 agentic commerce 迈了一大步,新的通用协议和 MCP server 让 AI agent 能直接管支付和分析,做 agent 或支付的开发者都得看看。
智能体
Google
MCP/工具
产品更新
AI HOT
·
2026-05-28 10:27
01:02 Qwen @ Alibaba_Qwen 精选 71 Qwen3.5在TokenSpeed推理引擎上,针对智能体工作负载达到了创纪录的580 tokens per second (tps)速度。这一成果由通义千问推理团队、lightseekorg Foundation TokenSpeed团队、NVIDIA及Mooncake团队共同实现,并采用了tri_dao的FlashAttention-4 (FA4) 优化。此里程碑标志着开源大语言模型推理性能的边界得到了推动,相关详情可查阅PyTorch社区博客。 PyTorch : The speed-of-light optimization for Qwen3.5 on the TokenSpeed inference engine is a significant milestone, achieving a r... 智能体 开源/仓库 推理 论文/研究 推荐理由: Qwen3.5在TokenSpeed上跑出580 tps,这是开源LLM推理的极限突破,对agent类应用是实实在在的性能跃进,PyTorch这篇博客值得每一个做推理部署的细读。
智能体
开源/仓库
推理
论文/研究
AI HOT
·
2026-05-28 10:27
01:20 Hugging Face:Blog(RSS) 精选 70 由Artificial Analysis和IBM推出的ITBench-AA SRE基准测试显示,所有前沿大模型得分均未超过50%。Claude Opus 4.7(自适应推理,最大努力)以47%领先,GPT-5.5(xhigh)和Qwen3.7 Max分别得46%和42%。该测试包含59个需要通过Shell命令调查Kubernetes事件快照并提交根因诊断的智能体任务。关键发现是模型推理轮次差异近3倍,但更长的轨迹并不转化为更高准确率,过度调查的模型会因提交误报而受罚。在成本方面,开源模型Gemma 4 31B(Reasoning)以每任务$0.14的成本获得37%得分,优于成本更高但得分更低的闭源模型。 智能体 Hugging Face 评测/基准 推荐理由: IT运维这事儿,AI还是新手。ITBench-AA这份基准把Claude Opus 4.7逼到47%,开源模型GLM-5.1却用五分之一成本拿到40%,企业场景性价比可能不在闭源那边。
智能体
Hugging Face
评测/基准
AI HOT
·
2026-05-28 10:27
01:34 Google Research:Blog(网页) 精选 69 Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境(TEE)的透明性,旨在实现前沿的隐私与安全保证。其核心是基于零信任原则,通过密码学与硬件保护的结合,确保系统仅能获取群体的匿名化聚合洞察。 Google 安全/对齐 端侧 论文/研究 推荐理由: Google 的隐私聚合新方案把多轮交互砍成一次提交,对做设备端联邦分析的人来说是工程上的一大步,而且结合 TEE 做双层防护,这个思路值得抄。
Google
安全/对齐
端侧
论文/研究
AI HOT
·
2026-05-28 10:27
01:35 Simon Willison 博客 精选 72 Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点,这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价,从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用,OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5(4月23日)和 Opus 4.7(4月16日)的 API 定价也显著高于前代版本。 Anthropic OpenAI 现象/趋势 编码 关联讨论 1 条 Hacker News 热门(buzzing.cc 中文翻译) 推荐理由: Simon 这篇把近期碎片线索串起来了,企业级定价变化加上代码代理消耗剧增,说明 Anthropic 和 OpenAI 可能真开始赚钱了,四月是个新拐点。
Anthropic
OpenAI
现象/趋势
编码
AI HOT
·
2026-05-28 10:27
01:36 Rohan Paul @ rohanpaul_ai 精选 79 行业动态 推荐理由: 黄仁勋亲自宣布的每年1500亿美元投资,不是小数目,这基本把NVIDIA的未来押在了台湾半导体生态上,AI硬件供应链的叙事又要被重写一遍。
行业动态
AI HOT
·
2026-05-28 08:13
08:07 Rohan Paul @ rohanpaul_ai 精选 77 Rohan Paul : Another great win for agentic coding. Cognition AI just raised over $1B at a $26B pre-money valuation. Revenue reportedl... 智能体 编码 行业动态 推荐理由: Cognition的10亿刀融资不是又一个demo故事,Devin已经进入高盛和奔驰的生产线,编码代理从玩具变工具的拐点到了。 07:30 宝玉 @ dotey 精选 75 用好 Coding Agent,重点是两头,尤其是开头的部分,如果一开始就走偏了后面怎么改都改不好。 用好 Coding Agent 的关键在于初始规划。方法是先将需求整理后,用最强模型(如 GPT-5.5、Claude Opus 4.7)分别在 Codex、Claude Code、Cursor 的 Plan 模式下生成设计方案,选择最优方案并借鉴其他版本。对于复杂计划,可将其拆分为多个 Phases 并明确要求与验证标准,形成 Markdown 文档。执行时按 Phases 进行,并辅以人工审核纠偏。最后的代码审核(Code Review)用 GPT-5.5 审核代码质量与设计符合度即可。应避免让多个智能体交叉 Review,否则可能导致代码越改越多。 akazwz : 让不同的 agent 交叉 review 的后果就是代码越改越多。。。 智能体 教程/实践 编码 推荐理由: 宝玉这套多Agent交叉设计Plan、人拍板、便宜模型执行的流程,是我见过最务实的Coding Agent实践,做开发的直接套用就行。 07:07 Anthropic:Research(发表成果 · 网页) 精选 68 社会科学中的编码智能体 一项针对1260名定量社会科学家的调查显示,虽然81%的受访者用过AI聊天机器人,但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异:以男性名字命名的研究者使用率是女性研究者的两倍;顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请,但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观,但对重塑整个社会科学领域持保留态度。这是一项初步调查,更深入研究仍在进行中。 智能体 Anthropic 数据/训练 论文/研究 推荐理由: Anthropic 这份调查把编码代理在社科领域的真实渗透率摸清了,只有 20% 的研究者真在用,而且男女、校际差距比 AI 聊天工具大得多,做学术工具的可以认真看看。 06:13 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 60 思科与OpenAI携手Codex重新定义企业工程
智能体
编码
行业动态
教程/实践
Anthropic
数据/训练
论文/研究
OpenAI
安全/对齐
Meta
搜索
MCP/工具
现象/趋势
产品更新
语音
多模态
推理
GitHub
开源/仓库
视频
部署/工程
政策/监管
Google
端侧
Hugging Face
评测/基准
大佬观点
xAI
AI HOT
·
2026-05-28 07:06
00:30 xAI @ xai 精选 69 智能体 xAI 产品更新 编码 推荐理由: xAI 把 grok 的编码模型塞进 Kilo Code,如果你本来就用这两个工具,这次集成能省不少事,但算不上行业震动。
智能体
xAI
产品更新
编码
AI HOT
·
2026-05-28 07:06
00:35 Chubby♨️ @ kimmonismus 精选 80 本文记录了与Google搜索产品副总裁Robby Stein在Google I/O的访谈,核心探讨Google Search向“AI原生”模式的重大转变。讨论话题包括AI Mode是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI搜索的高运行成本、Google TPU及基础设施的优势、AI时代搜索量不减反增的原因,以及优质AI回答与出版商流量之间的张力。访谈还涉及Google决定展示哪些信息源与链接的逻辑,并围绕一个核心问题展开:如果Google直接给出答案,传统的基于链接的网页生态将走向何方? Google 大佬观点 搜索 推荐理由: Google 搜索 VP 首次拆解 AI Mode 背后的成本逻辑、流量分配和 TPU 优势,比 I/O 演讲深得多,做搜索和内容生态的都值得听。
Google
大佬观点
搜索
AI HOT
·
2026-05-28 06:00
23:59 Perplexity @ perplexity_ai 精选 68 开源/仓库 部署/工程 推荐理由: Perplexity 开源的这个 tokenizer 能把 CPU 利用率砍掉五六倍,做实时推理的团队值得立马试试,对延迟敏感的场景是实打实的优化。 23:53 Claude @ claudeai 精选 63 Claude Marketplace 新增成员:@augmentcode、@boltdotnew、@coderabbitai、@hebbia 和 @WeAreLegora。 您现有的 Anthropic 消费承诺可用于购买其 Claude 驱动的产品。 了解更多:http://claude.com/platform/marketplace Claude : Introducing the Claude Marketplace, a way for enterprises to simplify their procurement of AI tools. Now in limited prev... Anthropic 产品更新 部署/工程 推荐理由: Anthropic 把企业采购 Claude 工具这一步真正统一了,但目前只是限量预览,实际能覆盖多少场景还得看后续伙伴名单。 23:04 Krea @ krea_ai 精选 62 今天,我们发布了 Krea 2 的 API。 现已在 @fal 或 @ComfyUI 等平台可用,通过 @NousResearch 的 Hermes 等智能体使用,并全面支持 Claude、Codex 或 OpenClaw。 了解如何设置 👇 智能体 产品更新 图像生成 关联讨论 1 条 X:Krea AI (@krea_ai) 推荐理由: Krea 2 把 API 一开,ComfyUI 和 Claude 都能调用了,做图像应用的兄弟们终于不用再自己搭模型了。 22:20 Hugging Face:Blog(RSS) 精选 68 通过万亿参数与 Hub Bucket 实现增量权重同步:TRL 中的增量权重同步 本文标题涉及 Hugging Face TRL 框架中一项具体的增量权重同步技术。正文重申了 Hugging Face 的核心使命,即致力于通过开源和开放科学,来推动人工智能的进步与普及。 Hugging Face 产品更新 开源生态 部署/工程 推荐理由: TRL 这个 Delta Weight Sync 摆明了给大模型分布式训练省时间,团队如果还在手动倒腾权重文件,值得点开看看,说不定省下的时间够喝杯咖啡。 22:10 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 56 使用 Codex 构建自改进税务智能体 OpenAI、Thrive 与 Crete 合作,使用 Codex 构建了
开源/仓库
部署/工程
Anthropic
产品更新
智能体
图像生成
Hugging Face
开源生态
OpenAI
教程/实践
MCP/工具
多模态
安全/对齐
行业动态
Google
检索增强
论文/研究
大佬观点
现象/趋势
推理
模型发布
政策/监管
编码
视频
7 / 36