标签

数据工程

MDASH:微软用上百个 AI Agent 组团挖漏洞

来源:infoq.com 19
微软最近公开了一套名为 MDASH(Multi-Model Agentic Security)的漏洞发现系统。这套系统不再依赖单模型"单打独斗",而是让超过 100 个专业化 AI Agent 协作完成从扫描、验证、辩论到最终证明漏洞的全流程。目标很明确——在 Windows 及其他微软大型代码库中,用自动化手段替代传统人工代码审计的瓶颈。 单模型做代...

Gemma 4 多令牌预测:投机解码让推理速度翻三倍

来源:infoq.com 24
大模型推理的瓶颈从来不是算力不够,而是逐令牌串行生成这一固有约束——每吐出一个 token 都要等上一轮前向传播完成。Gemma 4 引入的多令牌预测(Multi-Token Prediction, MTP)起草器,配合投机解码(speculative decoding),把这条串行链路变成了并行流水线:起草器一口气猜出多个 token,主模型一次前向...

Genkit 中间件:给 AI 应用加一层"可编程拦截网"

来源:infoq.com 19
生产环境里的 AI 应用,最让人头疼的不是模型本身,而是围绕模型调用的一堆"外围问题"——调用失败要不要重试?工具执行结果要不要做安全过滤?生成循环跑了 50 步还没停,谁来掐断?Google 最近为 Genkit 引入了 Middleware 架构,正是瞄准这些痛点:在模型调用、工具执行、生成循环这三条关键路径上,加了一层可编程的拦截层,让开发者用代...

AWS MCP Server 正式 GA:给 AI 编码代理一把有权限边界的钥匙

来源:infoq.com 34
AI 编码代理正在从"能写代码"走向"能操作基础设施"——但直接把 AWS 凭证塞给代理,等于把整栋楼的钥匙交给一个实习生。AWS 的 Model Context Protocol(MCP)服务器现在正式 GA,它做的事情很明确:用标准接口把 AWS API、文档和运维流程暴露给代理,同时用 IAM 做细粒度权限管控,每一步操作可审计。 MCP 是 A...

Uber Eats 如何用实时序列特征与列表级生成式推荐重塑首页 Feed

来源:infoq.com 45
Uber Eats 的首页推荐长期依赖手工特征和逐条打分——用户点了一个汉堡,系统 24 小时后才知道这件事,再逐个给候选餐厅算分数排序。这套流程在冷启动和实时意图捕捉上都有明显短板。最近 Uber 工程团队把整个 Home Feed 推荐系统翻了一遍:特征从手工拼接到 Transformer 序列建模,新鲜度从天级压缩到秒级,排序从逐条打分切换到列表...

InfoQ 推出 AI 工程认证:生产级 AI 系统从业者该关注什么

来源:infoq.com 32
生产环境中跑大模型应用的人,最近几年都有一个共同感受——从 demo 到上线之间有一道巨大的沟。RAG 检索不准、agent 行为不可控、评估体系缺失、上线后延迟和成本飙升……这些问题不是靠换一个模型就能解决的。InfoQ 刚上线了一个为期五周的在线 AI Engineering 认证项目,面向已经在生产系统里做 AI 的资深从业者,覆盖 RAG、ag...

Discord 用 Scylla Control Plane 把 ScyllaDB 运维从"人肉"变成自动化

来源:infoq.com 41
Discord 的基础设施团队规模不大,却要管着支撑数亿用户消息的 ScyllaDB 集群。以前做一次节点替换或集群扩容,几个人手动操作要耗好几天。他们干脆造了一个内部编排框架——Scylla Control Plane(SCP),把大规模 ScyllaDB 管理变成可编程的自动化流程。 Discord 从 Cassandra 迁移到 ScyllaDB...

Grok Skills:让大模型记住你的专业规则,跨对话持久生效

来源:infoq.com 31
大模型每次对话都从零开始——你反复粘贴同一份业务规则、同一段系统提示词,模型照忘不误。xAI 最新发布的 Grok Skills 直接对准了这个痛点:一次定义,全局生效。配合 Grok 4.3 Responses API 对 Tool Calling 的升级,开发者终于可以把"模型懂什么"和"模型怎么调用外部工具"这两件事分别管起来。 传统做法是把所有...

Cloudflare 用自建容器重写 Browser Run,拼完六层 Agent 基础设施的最后一块

来源:infoq.com 17
Cloudflare 的 Browser Rendering 一直是开发者做网页抓取、自动化测试时的热门选择,但底层跑的是第三方托管方案,并发和延迟都有天花板。最近 Cloudflare 把整个 Browser Run 搬到了自家 Containers 平台上,并发能力翻了 4 倍、响应速度快了 50%。更重要的是,这一步把 Cloudflare 的 ...