标签

工程效能

用多 Agent 系统接管工程支持:Grab 数据仓库平台的实践

来源:infoq.com 30
数据仓库平台团队最头疼的事不是写新功能,而是日复一日回答"这个查询为什么慢""表为什么没更新""权限怎么配"。Grab 的 Central Data Team 也被这类重复性支持请求拖住了手脚,直到他们用多 Agent AI 系统把调查和优化两类工作拆开、交给专门的 Agent 处理,才把工程师的时间从"灭火"拉回到真正的平台建设上。 Grab 的数据...

用多智能体系统替代救火式工程支持——Grab 数据团队的架构实践

来源:infoq.com 29
数据平台团队最头疼的不是技术难题,而是日复一日的重复性支持请求:表权限报错、管道延迟、数据质量异常……这些工单把工程师拖进"救火循环",真正该做的平台基建工作反而被挤到角落。Grab 的 Central Data Team 用一套多智能体系统把这类重复任务自动化,让工程师的精力重新回到平台建设上。 数据仓库平台一旦服务数百个业务团队,支持请求的量级会迅...

Gemini 3.5 Flash:速度翻 4 倍,Google 把赌注押在了 Agent 上

来源:oschina.net 21
Google I/O 2026 上,Gemini 3.5 Flash 正式亮相。这不是一次常规的模型迭代——从命名到定位,Google 明确把"Agentic"写进了产品基因。3.5 Flash 超越了上一代 3.1 Pro 在多项硬核基准上的成绩,同时把推理速度拉到 4 倍。对正在搭建 Agent 系统的开发者来说,这个组合值得认真拆解。 先看三个最...

Anthropic MCP 隧道:让 AI Agent 安全访问内网,数据不出墙

来源:infoq.com 15
企业想用自主 Agent,但不想把执行环境或内部系统暴露到公网——这是过去一年里最常被提起的矛盾。Anthropic 这次给出的答案是两条新能力:自托管沙箱和 MCP 隧道,都属于 Claude Managed Agents 平台的扩展。核心思路很简单:Agent 可以跑,但边界不能破。 自主 Agent 要干活,就得连数据库、读内部文档、调用私有 A...

BeetlSQL 3.40:用 JOOQ 补上类型安全多表查询这块短板

来源:oschina.net 14
BeetlSQL 从 2015 年一路迭代到现在,单表 CRUD、Markdown 式 SQL 模板、内置分页、多库切换——这些日常开发高频场景它都覆盖得不错。但有一个痛点一直没彻底解决:多表联合查询时的类型安全。写复杂 JOIN 的 SQL 模板,字段靠字符串拼,改一个列名编译器不会报错,跑到线上才炸。3.40 版本引入 JOOQ 集成,正是要堵这个...

PostgreSQL 为什么成了 AI 应用的默认数据库

来源:postgr.es 34
越来越多的 AI 产品在技术栈里选了 PostgreSQL——不是因为它重新包装成"AI 数据库",而是因为它本来就是团队最熟悉、最可靠的那层基础设施。Supabase 的普及加速了这一趋势:每次创建 Supabase 项目,底层就是一个 PostgreSQL 实例。主流 AI 框架对 PostgreSQL 和 pgvector 的直接支持,让向量检索...

用 Kyverno 自动化 Confidential Containers 基础设施,让应用团队不再操心底层细节

来源:cncf.io 30
Confidential Containers(CoCo)为容器工作负载提供了一层关键的安全隔离——即使在平台部分不可信的环境下,也能通过硬件可信执行环境(如 AMD SEV-SNP、Intel TDX)保护运行中的数据。但现实是:要让一个普通 Pod 跑在 CoCo 环境里,应用团队往往需要手动指定 、添加节点选择器、配置加密参数等一堆基础设施细节。...

当 AI 需要长期记忆:为什么 PostgreSQL 正在成为企业记忆基础设施

来源:postgr.es 31
当前的 AI 基础设施讨论几乎被模型、GPU、推理速度和向量数据库占据。这些组件确实重要,但它们掩盖了一个更深的架构问题——随着企业从 AI 实验走向运营系统,这个问题正在快速浮现:记忆。 不是简单存储聊天记录或 embedding 的那种记忆,而是跨长时间交互中维持持久上下文、操作连续性、历史理解、工作流状态、推理可追溯性和业务感知的能力。大多数 A...

Anthropic 发布托管 Agent、主动式工作流与能力阶梯曲线——Code with Claude 2026 要点与实践

来源:infoq.com 20
Anthropic 在旧金山举办的 "Code with Claude 2026" 活动上,一口气抛出三个方向性更新:托管 Agent 让开发者不再自己搭基础设施跑长任务;主动式工作流让 Claude 从"等指令"变成"推进度";能力阶梯曲线则试图把模型升级从模糊的"更强了"变成可预期的工程参数。GitHub、Vercel 和一批 AI-native ...

你的 LLM 评估体系正在悄悄失效

来源:oschina.net 30
刚从 DeepMind 离职的工程师 Lun Wang 抛出一个让人不安的判断:我们擅长评估已经存在的模型,却极不擅长评估即将构建的模型。尤其是当模型跨越到新的能力阶段时,现有的评估体系会失效——而你甚至不会察觉。 这不是一句空话。大多数基准测试、安全评估和红队演练协议都隐含一个假设:下一代模型是当前模型的更强版本。更强的推理、更广的知识、更快的响应。...