AI and technology watch

AI 新闻

聚合过去 24 小时 AI 与开发者生态动态,并提供来源链接以便深入阅读。

---
AI HOT ·

Cursor 团队发布《开发者习惯报告》

09:39 meng shao @ shao__meng 精选 75 报告显示,AI正深刻改变开发工作形态。开发者周均代码产出从约3.6K行增至8.6K行,更大规模的PR(千行以上)占比上升。AI智能体在单次会话中的工具调用数增加约30%,正在处理更复杂的任务。同时,被接受的AI代码在60分钟后的留存率从约76%提升至约81%,表明更多AI生成内容进入了实际代码库。这些趋势共同指向AI已从个人辅助工具,演进为推动开发向更大规模任务与自动化基础设施发展的核心力量。 Cursor : Introducing the Cursor Developer Habits Report. We're sharing some of our findings on how software development is changi... 智能体 现象/趋势 编码 推荐理由: Cursor 这份报告用真实数据揭示了 AI 编程的现状,代码量暴涨、Agent 变强、留存率提升,对开发者来说比看论文更有参考价值。

智能体 现象/趋势 编码
AI HOT ·

我们制作了一个15秒的动画IP预告片--从角色设定到最终视频。认识一下MILO和BUMBLE:地下邮政骑手 转发+关注+回复=我们会私信发送工作流程和提示词

10:44 PixVerse @ PixVerse_ 精选 65 多模态 教程/实践 视频 推荐理由: PixVerse 这条动画演示把‘角色设定到成片’的链条跑通了,虽然大概率还是精选过的案例,但对想做短视频 IP 的人,流程本身就值得抄一份。

多模态 教程/实践 视频
AI HOT ·

最好的设计工作不会在聊天框里发生。你需要空间来探索想法、创建变体并进行迭代。 认识新的 Replit Canvas。 你的智能体设计工具,用于构建精美的网站、应用、营销资产等。

04:52 Replit ⠕ @ Replit 精选 74 智能体 产品更新 推荐理由: Replit 终于在对话之外给了设计师一个能迭代的画布,把 Agent 直接塞进设计工具里,对用 AI 做 UI 的人来说比聊天框强太多了。

智能体 产品更新
AI HOT ·

Apple 正努力将庞大的 Gemini 模型塞进 iPhone 以驱动新 Siri

02:48 Ars Technica:AI(RSS) 精选 70 Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。由于模型规模庞大,本地处理可能无法完全实现,因此一个云端组件很可能是必然的选择。 Google 端侧 行业动态 推荐理由: 苹果想把谷歌最大的模型塞进iPhone来救Siri,如果真能本地跑,那安卓的端侧AI优势就没了,但蒸馏这么大的模型到手机,技术上挑战不小。

Google 端侧 行业动态
AI HOT ·

好消息!印度用户现在可以上传视频(来自相册或已保存文件),并使用Gemini Omni进行编辑和转换。快来试试,并告诉我们你的想法。

03:06 Google Gemini @ GeminiApp 精选 62 Vijay Choudhary : Gemini Omni seems to outperform everything. Crazy updates for Vibe Video Editing at #google Let's see when this update w... Google 产品更新 多模态 视频 推荐理由: Gemini Omni 的视频编辑终于从实验室走进日常,虽然目前只对印度开放,但这一步验证了 Omni 在视频创作上的实用下限,做视频的人可以提前关注。

Google 产品更新 多模态 视频
AI HOT ·

在 @OpenHandsDev 上使用 MiniMax M2.7 进行免费智能体编程? 是的,请给我!限时提供 ⚡👀

03:22 MiniMax (official) @ MiniMax_AI 精选 76 OpenHands : We have also partnered with @MiniMax_AI to provide *free access to agents with MiniMax-M2.7* for a limited time! This is... 智能体 产品更新 编码 推荐理由: MiniMax把M2.7免费接到OpenHands里跑Agent编码,而且限时,这对个人开发者是实打实的免费用机会,不妨上去跑几个任务体验下性价比。

智能体 产品更新 编码
AI HOT ·

hexoai开源SIA框架:AI智能体实现递归自我改进

02:44 Rohan Paul @ rohanpaul_ai 精选 75 hexoai开源了SIA(自我改进AI)框架。该框架展示了AI智能体不仅能优化其外部工作流(harness),还能通过任务反馈直接更新自身的模型权重,从而在领域知识和能力上实现自主提升,而非仅依赖人类提供的提示或工具改进。论文报告显示,SIA在LawBench基准上性能提升56.6%,在GPU kernels运行上耗时减少91.9%,在单细胞RNA去噪任务中相比基线提升502%。 Kunal Bhatia : Superintelligence will be built on Self Improvement. Today @hexoai, we're excited to release 'SIA' - an open-source Self... 智能体 数据/训练 论文/研究 推荐理由: 不再只是给AI换提示词,SIA框架连模型自己的权重都更新了,在三个任务里分别提升了56%、502%和91%加速,开源出来会让整个Agent开发范式重新思考。

智能体 数据/训练 论文/研究
AI HOT ·

Grok Build 0.1 on API

02:42 xAI:News(网页) 精选 82 xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段。该模型专为智能体编码任务训练,支持网页开发、调试和 MCP,同时也是驱动 Grok Build CLI 的同一模型。其推理速度超过 100 tokens/秒,定价为输入 $1/m tokens,输出 $2/m tokens。除编码外,它也适用于通用智能体及工具调用场景,并可通过 OpenRouter 和 Vercel AI Gateway 获取。 xAI 模型发布 编码 关联讨论 2 条 X:xAI (@xai) X:阿易 AI Notes (@AYi_AInotes) 推荐理由: xAI 把编码模型卷到了 100+ t/s 和 $2/M 输出,专攻 agentic coding,这是直接在叫板 Claude Code 和 Cursor,做开发工具的同行该重新算账了。

xAI 模型发布 编码
AI HOT ·

Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元

02:35 Anthropic:Newsroom(网页) 精选 81 Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,投后估值达 9650 亿美元。公司表示其旗舰模型 Claude 的企业部署持续增长,年化收入已突破 470 亿美元。此轮融资将用于推进 AI 安全与可解释性研究、扩展算力以满足 Claude 的需求,并规模化产品与合作伙伴关系。Anthropic 近期已显著扩大计算容量,并宣布 Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。 Anthropic 行业动态 关联讨论 10 条 X:Kim (@kimmonismus) X:Anthropic (@AnthropicAI) TechCrunch:AI(RSS) X:Rohan Paul (@rohanpaul_ai) Hacker News 热门(buzzing.cc 中文翻译) X:Testing Catalog (@testingcatalog) The Decoder:AI News(RSS) X:洪明 (@hongming731) X:小互 (@xiaohu) X:阿易 AI Notes (@AYi_AInotes) 推荐理由: 65B的融资规模基本封死了其他玩家追赶的门槛,Claude的算力和研发投入将远超同行,做应用的可以放心上船了。

Anthropic 行业动态
AI HOT ·

使用 Google Pay & Wallet Developer MCP server 加速你的集成工作流

02:41 Google Developers Blog(RSS) 精选 73 Google 推出 Google Pay & Wallet Developer MCP server,这是一款开放标准工具,旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境,即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦,从而加速开发工作流。 Google MCP/工具 产品更新 推荐理由: 这是 Google 为支付场景做的 MCP 服务器,把文档和账户操作直接塞进 IDE,减少上下文切换,做 Google Pay 集成的开发者可以试试看。

Google MCP/工具 产品更新
AI HOT ·

🍌 Nano Banana Pro 【gemini-3-pro-image】 和 Nano Banana 2 【gemini-3.1-flash-image】 现已正式发布,可通过 Gemini API 投入生产使用。查看这些优秀的社区示例,了解两个模型的实际能力 🧵↓

01:42 Google AI Developers @ googleaidevs 精选 71 Google 图像生成 模型发布 关联讨论 1 条 X:Google AI for Developers (@googleaidevs) 推荐理由: Google 把 Gemini 图像生成能力打包进 Nano Banana 系列并正式 GA,开发者现在可以稳定调用 Pro 和 Flash 级别的生图 API,对做图像应用的团队是个实在利好。

Google 图像生成 模型发布
AI HOT ·

阶跃星辰的Step 3.7 Flash已在OpenRouter上线。 这是一个多模态(图像/视频/文本)MoE模型,196B参数中仅激活11B。针对编码、智能体工作流和结构化输出进行了调优,并提供可选的推理级别,以权衡速度、成本和深度。

11:06 OpenRouter @ OpenRouter 精选 69 智能体 多模态 模型发布 编码 推荐理由: 阶跃的这个MoE只激活11B参数,多模态且能调推理深度,OpenRouter直接上线等于把低成本Agent开发的门又往下拉了一把,做coding agent的可以跑一下试试。 10:44 PixVerse @ PixVerse_ 精选 65 我们制作了一个15秒的动画IP预告片--从角色设定到最终视频。认识一下MILO和BUMBLE:地下邮政骑手 转发+关注+回复=我们会私信发送工作流程和提示词 多模态 教程/实践 视频 推荐理由: PixVerse 这条动画演示把‘角色设定到成片’的链条跑通了,虽然大概率还是精选过的案例,但对想做短视频 IP 的人,流程本身就值得抄一份。 09:39 meng shao @ shao__meng 精选 75 Cursor 团队发布《开发者习惯报告》 报告显示,AI正深刻改变开发工作形态。开发者周均代码产出从约3.6K行增至8.6K行,更大规模的PR(千行以上)占比上升。AI智能体在单次会话中的工具调用数增加约30%,正在处理更复杂的任务。同时,被接受的AI代码在60分钟后的留存率从约76%提升至约81%,表明更多AI生成内容进入了实际代码库。这些趋势共同指向AI已从个人辅助工具,演进为推动开发向更大规模任务与自动化基础设施发展的核心力量。 Cursor : Introducing the Cursor Developer Habits Report. We're sharing some of our findings on how software development is changi... 智能体 现象/趋势 编码 推荐理由: Cursor 这份报告用真实数据揭示了 AI 编程的现状,代码量暴涨、Agent 变强、留存率提升,对开发者来说比看论文更有参考价值。 09:21 IT之家(RSS) 精选 71 三星电子业内率先出样 HBM4E 内存 数据/训练 行业动态 推荐理由: 三星的HBM4E把单堆栈带宽推到3.6TB/s,能效再提16%,对LLM训练是实打实的硬件升级,做AI基础设施和模型训练的可以关注后续量产时间。 09:21 IT之家(RSS) 精选 71 特斯拉 FSD 安全性宣称遭质疑 特斯拉声称其全自动驾驶软件(FSD)安全性最高可达人类的10倍,但路透社调查发现此数据经不起推敲。参与训练FSD的员工表示该技术远未成熟,其安全演示高度依赖人工。统计方法被11位交通安全研究人员指出存在缺陷,例如与更广泛的联邦事故数据进行不恰当比较。相比之下,竞争对手Waymo采用了更严谨的统计方法。目前,特斯拉FSD仍需驾驶员主动监督,安全部署可能还需数年。 安全/对齐 行业动态 推荐理由: 路透社的调

智能体 多模态 模型发布 编码 教程/实践 视频 现象/趋势 数据/训练 行业动态 安全/对齐 Anthropic GitHub 产品更新 开源/仓库 开源生态 推理 评测/基准 OpenAI 大佬观点 xAI Google 端侧 论文/研究 MCP/工具 部署/工程 图像生成 政策/监管 Microsoft
AI HOT ·

Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

01:05 Anthropic:Newsroom(网页) 精选 85 Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增“动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。此外,其诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。 智能体 Anthropic 推理 模型发布 关联讨论 17 条 X:Thariq (@trq212) X:Rohan Paul (@rohanpaul_ai) X:Boris Cherny (@bcherny) X:opencode (@opencode) The Decoder:AI News(RSS) X:OpenRouter (@OpenRouter) X:Artificial Analysis (@ArtificialAnlys) MarkTechPost(RSS) X:洪明 (@hongming731) X:邵猛 (@shao__meng) X:Claude (@claudeai) Hacker News 热门(buzzing.cc 中文翻译) X:Kim (@kimmonismus) TechCrunch:AI(RSS) X:Claude Devs (@ClaudeDevs) X:Testing Catalog (@testingcatalog) X:宝玉 (@dotey) 推荐理由: Opus 4.8看着是常规升级,但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头,快速模式降价三倍更是直接拉低了实时场景的入场券。

智能体 Anthropic 推理 模型发布
AI HOT ·

在Claude Code中引入动态工作流

01:21 Claude:Blog(网页) 精选 78 Claude Code 推出“动态工作流”功能,使 Claude 能端到端处理复杂任务。该功能通过动态编写脚本,在单个会话中并行运行数十到数百个子智能体来完成工作,并会在结果呈现前进行验证。它适用于跨代码库的 bug 查找、大规模迁移(如将 Bun 从 Zig 移植到 Rust)等需要多角度分析的任务。该功能现已在研究预览阶段可用,支持 Claude Code CLI、桌面端、VS Code 扩展以及 API、Amazon Bedrock、Vertex AI 等平台,面向 Max、Team 及已启用的 Enterprise 计划用户。 智能体 Anthropic 产品更新 编码 关联讨论 2 条 X:邵猛 (@shao__meng) X:Claude Devs (@ClaudeDevs) 推荐理由: 动态工作流第一次让 Claude Code 能独立搞定需要并行协调的大规模工程任务,Bun 从 Zig 到 Rust 只用了十一天,这对复杂代码库的维护和迁移是降维打击。

智能体 Anthropic 产品更新 编码
AI HOT ·

阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens

09:21 IT之家(RSS) 精选 71 智能体 Hugging Face 多模态 模型发布 推荐理由: 阶跃星辰这个Flash模型把Agent优化刻进了DNA,原生支持Claude Code等主流框架,400 Tokens/s的速度和11B激活参数量,对做Agent应用的团队来说是个值得试试的开源选择。

智能体 Hugging Face 多模态 模型发布
AI HOT ·

Data Formulator 为企业数据工作流引入了 AI 驱动的分析功能。数据团队可以轻松将企业数据带入一个 AI 就绪的工作空间,用户可以使用 AI 智能体来探索、分析和可视化数据,将原始数据转化为可操作的洞察:https://msft.it/6013vZzUl

00:22 Microsoft Research @ MSFTResearch 精选 63 智能体 Microsoft 产品更新 推荐理由: Data Formulator 这个工具像是把 Copilot 塞进了数据分析流程,对企业数据团队来说算个实用升级,但没到非用不可的程度。

智能体 Microsoft 产品更新
AI HOT ·

OpenAI 的前沿治理框架

00:28 OpenAI:官网动态(RSS · 排除企业/客户案例) 精选 65 OpenAI 发布了“前沿治理框架”,阐述其 AI 安全、安全与风险管理实践如何与欧盟和加州新出台的法规要求对齐。该框架旨在规范其前沿模型的开发与部署流程。 OpenAI 安全/对齐 政策/监管 推荐理由: OpenAI 首次把内部安全实践打包成一个对外框架,是为了应对欧盟和加州监管。与其说是技术突破,不如说是合规信号,所有做前沿模型的公司都得开始交这份作业了。

OpenAI 安全/对齐 政策/监管
AI HOT ·

AI智能体时代下的安全变革

00:33 Tomer Tunguz 博客(VC 分析) 精选 61 Lemonade的CISO Jonathan Jaffe探讨了AI智能体时代的安全新挑战。他指出,AI对攻击者和防御者同样强大,但可被利用的漏洞窗口正在缩小,因为AI能更快地生成、审查和修补代码。为此,安全团队正向工程团队转型,例如Lemonade的安全部门均由工程师组成,并构建了包含智能体的内部AI平台。同时,每个智能体(单个终端上可能运行200到10000个)都需要被赋予身份,并在操作点由策略进行更复杂的管控,这超越了当前身份与访问管理系统的能力。 智能体 MCP/工具 大佬观点 推荐理由: Jaffe 给出的结论很提气,AI 对防御方的加成被市场严重低估了,尤其每个 Agent 必须拥有身份和策略控制这个预判,值得所有在做 Agent 架构的人看一遍。

智能体 MCP/工具 大佬观点