AI and technology watch

AI 快讯

聚合 24 小时内的人工智能与开发者生态动态,保留来源链接方便继续阅读。

---
AI HOT ·

彩色噪声扩散采样

14:30 HuggingFace Daily Papers(社区热门论文) 精选 71 扩散模型的生成轨迹具有频谱偏差,早期处理低频全局结构,后期处理高频细节。传统随机微分方程求解器在整个过程中均匀注入白噪声,能量分配效率低。本研究提出彩色噪声采样(CNS),一种免训练的即插即用采样器。它通过动态、随时间和频率调整的噪声调度,更高效地将能量分配给尚未解析的频段。在SiT、JiT、FLUX等架构上的实验表明,CNS作为推理时的替换采样器显著提升了生成质量:在ImageNet-256上,无引导FID在SiT-XL/2上从8.26降至6.27,在JiT-B/16上从32.39降至26.69,在JiT-H/16上从11.88降至8.31,并且在使用无分类器引导时带来一致改进。 图像生成 论文/研究 推荐理由: 扩散模型采样时的白噪声注入一直很粗糙,这篇论文用动态调制的有色噪声把能量怼到未解析的频段,在多个模型上 FID 直接骨折,而且完全训练无关,拿来就能用。

图像生成 论文/研究
AI HOT ·

阶跃星辰 Step 3.7 Flash 发布,聚焦智能体效率

08:09 StepFun @ StepFun_ai 精选 75 阶跃星辰(Step)发布了开源大模型 Step 3.7 Flash,主打智能体(Agent)工作流的效率。该模型在 ClawEval-1.1(67.1分)和 SimpleVQA Search(79.2分)评测中排名第一。其架构为 198B 参数的 MoE,约 11B 为活跃参数,支持 256K 上下文。模型具备多模态理解能力,能处理图像、文档并生成代码或调用工具执行任务。在工具使用方面,它致力于高可靠性,τ²-bench 得分超过 98%。Step 3.7 Flash 兼容 Claude Code、MCP 协议等工具链,并支持在 Mac Studio M4 Max 等设备上本地运行。模型权重以 Apache 2.0 许可开源。 智能体 多模态 开源生态 推理 关联讨论 3 条 X:阶跃星辰 StepFun (@StepFun_ai) IT之家(RSS) X:OpenRouter (@OpenRouter) 推荐理由: Step 3.7 Flash 把 Agent 效率卷到新高度,开源权重且能跑在 Mac 上,做智能体的可以试试。

智能体 多模态 开源生态 推理
AI HOT ·

llm-anthropic 0.25.1

08:41 Simon Willison 博客 精选 72 llm-anthropic 发布 0.25.1 版本。主要更新包括:新增 Claude Opus 4.8 (`claude-opus-4.8`) 模型;为账户启用了该功能的组织新增了 `-o fast 1` 选项以使用快速模式;调整了各模型的默认 `max_tokens` 值,使其直接使用模型的最大输出长度,而非固定的 8,192。 Anthropic GitHub 产品更新 开源/仓库 推荐理由: Simon 的 llm 插件第一时间支持了 Claude Opus 4.8,如果你用他的 CLI 工具切换模型,这次更新能让你马上用到新模型和 fast mode。

Anthropic GitHub 产品更新 开源/仓库
AI HOT ·

特斯拉 FSD 安全性宣称遭质疑

09:21 IT之家(RSS) 精选 71 特斯拉声称其全自动驾驶软件(FSD)安全性最高可达人类的10倍,但路透社调查发现此数据经不起推敲。参与训练FSD的员工表示该技术远未成熟,其安全演示高度依赖人工。统计方法被11位交通安全研究人员指出存在缺陷,例如与更广泛的联邦事故数据进行不恰当比较。相比之下,竞争对手Waymo采用了更严谨的统计方法。目前,特斯拉FSD仍需驾驶员主动监督,安全部署可能还需数年。 安全/对齐 行业动态 推荐理由: 路透社的调查锤得很实,特斯拉FSD的「10倍安全」根本经不起对比,连自家数据标注员都不敢坐。这是今年自动驾驶行业最响的一记警钟。

安全/对齐 行业动态
AI HOT ·

三星电子业内率先出样 HBM4E 内存

09:21 IT之家(RSS) 精选 71 数据/训练 行业动态 推荐理由: 三星的HBM4E把单堆栈带宽推到3.6TB/s,能效再提16%,对LLM训练是实打实的硬件升级,做AI基础设施和模型训练的可以关注后续量产时间。

数据/训练 行业动态
AI HOT ·

Cursor 团队发布《开发者习惯报告》

09:39 meng shao @ shao__meng 精选 75 报告显示,AI正深刻改变开发工作形态。开发者周均代码产出从约3.6K行增至8.6K行,更大规模的PR(千行以上)占比上升。AI智能体在单次会话中的工具调用数增加约30%,正在处理更复杂的任务。同时,被接受的AI代码在60分钟后的留存率从约76%提升至约81%,表明更多AI生成内容进入了实际代码库。这些趋势共同指向AI已从个人辅助工具,演进为推动开发向更大规模任务与自动化基础设施发展的核心力量。 Cursor : Introducing the Cursor Developer Habits Report. We're sharing some of our findings on how software development is changi... 智能体 现象/趋势 编码 推荐理由: Cursor 这份报告用真实数据揭示了 AI 编程的现状,代码量暴涨、Agent 变强、留存率提升,对开发者来说比看论文更有参考价值。

智能体 现象/趋势 编码
AI HOT ·

我们制作了一个15秒的动画IP预告片--从角色设定到最终视频。认识一下MILO和BUMBLE:地下邮政骑手 转发+关注+回复=我们会私信发送工作流程和提示词

10:44 PixVerse @ PixVerse_ 精选 65 多模态 教程/实践 视频 推荐理由: PixVerse 这条动画演示把‘角色设定到成片’的链条跑通了,虽然大概率还是精选过的案例,但对想做短视频 IP 的人,流程本身就值得抄一份。

多模态 教程/实践 视频
AI HOT ·

最好的设计工作不会在聊天框里发生。你需要空间来探索想法、创建变体并进行迭代。 认识新的 Replit Canvas。 你的智能体设计工具,用于构建精美的网站、应用、营销资产等。

04:52 Replit ⠕ @ Replit 精选 74 智能体 产品更新 推荐理由: Replit 终于在对话之外给了设计师一个能迭代的画布,把 Agent 直接塞进设计工具里,对用 AI 做 UI 的人来说比聊天框强太多了。

智能体 产品更新
AI HOT ·

Apple 正努力将庞大的 Gemini 模型塞进 iPhone 以驱动新 Siri

02:48 Ars Technica:AI(RSS) 精选 70 Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。由于模型规模庞大,本地处理可能无法完全实现,因此一个云端组件很可能是必然的选择。 Google 端侧 行业动态 推荐理由: 苹果想把谷歌最大的模型塞进iPhone来救Siri,如果真能本地跑,那安卓的端侧AI优势就没了,但蒸馏这么大的模型到手机,技术上挑战不小。

Google 端侧 行业动态
AI HOT ·

好消息!印度用户现在可以上传视频(来自相册或已保存文件),并使用Gemini Omni进行编辑和转换。快来试试,并告诉我们你的想法。

03:06 Google Gemini @ GeminiApp 精选 62 Vijay Choudhary : Gemini Omni seems to outperform everything. Crazy updates for Vibe Video Editing at #google Let's see when this update w... Google 产品更新 多模态 视频 推荐理由: Gemini Omni 的视频编辑终于从实验室走进日常,虽然目前只对印度开放,但这一步验证了 Omni 在视频创作上的实用下限,做视频的人可以提前关注。

Google 产品更新 多模态 视频
AI HOT ·

在 @OpenHandsDev 上使用 MiniMax M2.7 进行免费智能体编程? 是的,请给我!限时提供 ⚡👀

03:22 MiniMax (official) @ MiniMax_AI 精选 76 OpenHands : We have also partnered with @MiniMax_AI to provide *free access to agents with MiniMax-M2.7* for a limited time! This is... 智能体 产品更新 编码 推荐理由: MiniMax把M2.7免费接到OpenHands里跑Agent编码,而且限时,这对个人开发者是实打实的免费用机会,不妨上去跑几个任务体验下性价比。

智能体 产品更新 编码
AI HOT ·

hexoai开源SIA框架:AI智能体实现递归自我改进

02:44 Rohan Paul @ rohanpaul_ai 精选 75 hexoai开源了SIA(自我改进AI)框架。该框架展示了AI智能体不仅能优化其外部工作流(harness),还能通过任务反馈直接更新自身的模型权重,从而在领域知识和能力上实现自主提升,而非仅依赖人类提供的提示或工具改进。论文报告显示,SIA在LawBench基准上性能提升56.6%,在GPU kernels运行上耗时减少91.9%,在单细胞RNA去噪任务中相比基线提升502%。 Kunal Bhatia : Superintelligence will be built on Self Improvement. Today @hexoai, we're excited to release 'SIA' - an open-source Self... 智能体 数据/训练 论文/研究 推荐理由: 不再只是给AI换提示词,SIA框架连模型自己的权重都更新了,在三个任务里分别提升了56%、502%和91%加速,开源出来会让整个Agent开发范式重新思考。

智能体 数据/训练 论文/研究
AI HOT ·

Grok Build 0.1 on API

02:42 xAI:News(网页) 精选 82 xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段。该模型专为智能体编码任务训练,支持网页开发、调试和 MCP,同时也是驱动 Grok Build CLI 的同一模型。其推理速度超过 100 tokens/秒,定价为输入 $1/m tokens,输出 $2/m tokens。除编码外,它也适用于通用智能体及工具调用场景,并可通过 OpenRouter 和 Vercel AI Gateway 获取。 xAI 模型发布 编码 关联讨论 2 条 X:xAI (@xai) X:阿易 AI Notes (@AYi_AInotes) 推荐理由: xAI 把编码模型卷到了 100+ t/s 和 $2/M 输出,专攻 agentic coding,这是直接在叫板 Claude Code 和 Cursor,做开发工具的同行该重新算账了。

xAI 模型发布 编码
AI HOT ·

Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元

02:35 Anthropic:Newsroom(网页) 精选 81 Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,投后估值达 9650 亿美元。公司表示其旗舰模型 Claude 的企业部署持续增长,年化收入已突破 470 亿美元。此轮融资将用于推进 AI 安全与可解释性研究、扩展算力以满足 Claude 的需求,并规模化产品与合作伙伴关系。Anthropic 近期已显著扩大计算容量,并宣布 Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。 Anthropic 行业动态 关联讨论 10 条 X:Kim (@kimmonismus) X:Anthropic (@AnthropicAI) TechCrunch:AI(RSS) X:Rohan Paul (@rohanpaul_ai) Hacker News 热门(buzzing.cc 中文翻译) X:Testing Catalog (@testingcatalog) The Decoder:AI News(RSS) X:洪明 (@hongming731) X:小互 (@xiaohu) X:阿易 AI Notes (@AYi_AInotes) 推荐理由: 65B的融资规模基本封死了其他玩家追赶的门槛,Claude的算力和研发投入将远超同行,做应用的可以放心上船了。

Anthropic 行业动态
AI HOT ·

使用 Google Pay & Wallet Developer MCP server 加速你的集成工作流

02:41 Google Developers Blog(RSS) 精选 73 Google 推出 Google Pay & Wallet Developer MCP server,这是一款开放标准工具,旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境,即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦,从而加速开发工作流。 Google MCP/工具 产品更新 推荐理由: 这是 Google 为支付场景做的 MCP 服务器,把文档和账户操作直接塞进 IDE,减少上下文切换,做 Google Pay 集成的开发者可以试试看。

Google MCP/工具 产品更新
AI HOT ·

🍌 Nano Banana Pro 【gemini-3-pro-image】 和 Nano Banana 2 【gemini-3.1-flash-image】 现已正式发布,可通过 Gemini API 投入生产使用。查看这些优秀的社区示例,了解两个模型的实际能力 🧵↓

01:42 Google AI Developers @ googleaidevs 精选 71 Google 图像生成 模型发布 关联讨论 1 条 X:Google AI for Developers (@googleaidevs) 推荐理由: Google 把 Gemini 图像生成能力打包进 Nano Banana 系列并正式 GA,开发者现在可以稳定调用 Pro 和 Flash 级别的生图 API,对做图像应用的团队是个实在利好。

Google 图像生成 模型发布