标签

LLM

默认入侵必然发生：从工具堆叠转向企业韧性工程

2026-07-28 来源: cloud.google.com 33

机器速度的攻击和 AI 生成漏洞利用吸引了大量注意力，但一线事件数据指向了一个更朴素的现实：多数成功入侵仍然始于未修复漏洞、身份控制薄弱、流程断裂和人员判断失误。M-Trends 2026 的研究显示，漏洞利用连续第六年成为最常见的初始感染向量，占 32%；语音钓鱼升至第二位，占 11%；在勒索软件相关事件中，“先前已被攻陷”则是排名第一的已确认入口。...

# AI # GCP # Go

阅读全文

PostgreSQL MVCC 的代价：真正该比较的是谁为历史版本买单

2026-07-27 来源: postgr.es 18

PostgreSQL 的 MVCC 经常因表膨胀、写放大、VACUUM 调优和 32 位事务 ID 被批评。这些问题都真实存在，但只说“PostgreSQL 的 MVCC 很差”还少问了一步：如果读者不能阻塞写者，那么旧版本必须保存在某个地方，清理成本也必须由某个组件承担。不同数据库没有消灭这笔成本，只是决定由写入、历史读取、缓存、临时空间还是后台整理...

# AI # Azure # Go

阅读全文

用 Google Antigravity CLI 在终端中阅读、审查与重构 Python 代码

2026-07-27 来源: realpython.com 16

Google Antigravity CLI 是一个运行在终端中的 AI 编码代理。它的价值不只是生成几行代码，而是直接围绕现有项目开展工作：读取文件、梳理调用关系、发现问题，并协助完成受约束的重构。对于 Python 项目，这种工作方式尤其自然。开发者可以把代码、测试和配置留在原来的目录中，通过明确的任务描述让代理先分析、再修改，最后用测试和静态检...

# AI # Go # LLM

阅读全文

NOAA 将核心天气预报迁上云：云端 HPC 如何支撑下一代数值天气预测

2026-07-27 来源: cloud.google.com 24

美国国家海洋和大气管理局（NOAA）选择 Google Cloud 作为天气与气候业务超级计算系统（WCOSS）的主要高性能计算基础设施提供商。这不只是一次机房搬迁，而是业务级数值天气预测（Numerical Weather Prediction，NWP）从传统本地超算向云优先架构转型的重要案例。天气预报系统必须在固定时间窗口内处理海量观测数据、运行...

# AI # GCP # Go

阅读全文

用 Google Antigravity CLI 审阅与重构 Python：一套可验证的终端工作流

2026-07-27 来源: realpython.com 24

Google Antigravity CLI 是一个运行在终端中的 AI 编码代理，适合读取、审查和重构 Python 代码。真正值得关注的并不是“让 AI 写出更多代码”，而是如何把代理放进现有工程流程：先限定任务，再检查改动，最后用测试验证结果。由于来源摘要没有给出具体版本的安装方式和子命令，下面不会假定某个固定 CLI 接口。实际使用前应先执行...

# AI # Go # LLM

阅读全文

用 AI Gateway 隔离模型剧变：面向智能体系统的演进式架构

2026-07-27 来源: infoq.com 14

传统 API Gateway 建立在两个稳定假设之上：服务会产生相对确定的结果，接口契约也能用简单 schema 描述。智能体 AI 打破了这些假设。一次请求可能触发多轮推理、调用外部工具、修改业务数据，甚至因为模型升级而改变决策路径。企业需要的不只是一个转发模型请求的代理，而是一个能够集中执行护栏、模型路由、智能体身份、动作策略和语义审计的控制平面。...

# AI # InfoQ # LLM

阅读全文

Cosmos-H-Dreams：实时生成式仿真如何进入手术机器人研发流程

2026-07-27 来源: huggingface.co 29

NVIDIA Cosmos-H-Dreams 把“实时生成式仿真”带到手术机器人这一高风险领域。这里的关键变化不是生成更逼真的演示视频，而是让仿真环境能够持续响应机器人动作，为策略训练、异常场景构造和回归测试提供动态数据。由于来源没有给出公开 API、模型结构或性能指标，下面不会假定具体接口，而是围绕标题所指向的工程方向，给出一套可落地的集成思路。传...

# AI # Hugging Face # LLM

阅读全文

Netflix 如何用 Triton 与 vLLM 构建内部大模型推理平台

2026-07-27 来源: infoq.com 27

把大语言模型接入生产环境，难点远不止启动一个推理服务。Netflix 分享的核心经验指向了更棘手的问题：模型尺寸不同、GPU 需求不同、推理引擎快速演进，而业务方仍然希望通过稳定、统一的平台调用模型。Triton 与 vLLM 的价值，正是在模型运行时与平台接口之间建立一个可治理的服务层。传统机器学习平台通常围绕相对稳定的模型格式、批处理策略和硬件配...

# AI # InfoQ # LLM

阅读全文

美团否认 LongCat 模型负责人离职：大模型团队更需要可验证的工程连续性

2026-07-27 来源: oschina.net 31

近日，市场传出美团 LongCat 团队基础模型负责人裴鹏即将离职的消息，美团随后公开回应称该消息不属实。公开信息显示，裴鹏毕业于北京大学，2023 年加入美团，先后担任基座模型团队预训练负责人及 LongCat 团队基础模型负责人，牵头大语言模型、多模态模型与 Agent 智能体模型研发，并主导推进万亿参数大模型。这次澄清处理的是一条人事传言，但它...

# AI # LLM # 全栈

阅读全文

Debian 讨论 LLM 贡献禁令：开源项目如何审查生成式 AI 代码

2026-07-27 来源: oschina.net 18

Debian 开发者正在讨论一项关于大型语言模型与生成式 AI 使用边界的通用决议。其中一个方案主张，明确禁止向 Debian 提交任何由 LLM 或其他生成式 AI 工具编写、辅助编写的贡献。覆盖范围不只包括源代码包，也涉及 lintian 等 Debian 官方软件、项目网络资源，以及贡献者添加的其他内容。这场讨论的核心并不是“AI 写的代码是否...

# AI # LLM # 全栈

阅读全文