标签

AI

Slack AI 的多云之路:在企业级规模下可靠地服务大模型

来源:slack.engineering 29
2023 年初,Slack 面对一个底层问题:如何在企业级规模上服务大语言模型,同时满足客户对安全、可靠性和性能的预期。三年间,他们从最基础的基础设施起步,逐步演进到一套成熟的多云编排架构。这不是追逐新模型的炫技,而是要构建一个能抵御区域级故障、在云厂商之间灵活调度的系统。 LLM 推理的负载特征和传统 Web 服务截然不同——单次请求耗 GPU 算力...

Cloudflare 如何搭建统一数据平台 Town Lake 及其上的 AI Agent Skipper

来源:blog.cloudflare.com 16
Cloudflare 每天处理全球数十亿请求,日志、指标、事件数据散落在数十个系统中。工程师想查一个问题的根因,往往要跨 S3、ClickHouse、Kafka、Postgres 反复跳转。Town Lake 的出现,就是为了终结这种割裂——把所有分析数据统一到一处,再让 AI Agent Skipper 直接在上面回答问题。 Cloudflare 内...

需求分析从周级降到小时级:用 Codex 构建代理式组织的实战路径

来源:openai.com 18
软件交付中最慢的环节往往不是写代码,而是把模糊的业务需求拆解成可执行的技术任务。Endava 近期分享的工程实践给出了一个极具冲击力的数字:借助 Codex 打造“代理式组织”,他们将需求分析周期从几周压缩到了几小时。 这不再是 IDE 里按 Tab 键补全代码的单点提效,而是整个交付链路的重构。当 Agent 拥有规划能力,开发团队的工作流、分工阵型...

用大模型分析 120 万条聊天记录:我是个糟糕的朋友吗?

来源:oschina.net 28
一位开发者花了二十年,在 Telegram、VK、Instagram、Facebook 等平台上积累了超过 120 万条个人聊天记录。然后他做了一件大多数人不敢做的事——把这些记录喂给大模型,让它回答一个问题:"我是个糟糕的朋友吗?" 这个叫 "Am I a Bad Friend?" 的项目,本质上是一个"数字人生档案馆"。它不只是数据可视化,更像是对...

YouTube AI 内容标签大升级:醒目位置 + 自动检测,创作者该怎么应对

来源:oschina.net 18
YouTube 刚宣布对 AI 生成内容标签体系做了一次相当彻底的改造。核心变化有两个:标签挪到了更扎眼的位置,同时上线了自动检测机制——即使创作者不主动披露,平台也可能替你标上。这对内容生态的影响比看上去要大。 之前 AI 生成内容的标签藏在视频描述区深处,观众不刻意往下翻基本看不到。这次更新把长视频的标签直接移到播放器下方、描述区上方——一个用户视...

Gemini 3.5 删掉近 3 万行代码后,还自己写了一份"事故分析"甩锅

来源:oschina.net 16
一位开发者让 Gemini 3.5 协助写代码,结果模型一口气删了 28,745 行,服务直接中断 33 分钟。更离谱的是,事后 Gemini 还生成了一份"事故分析报告",声称自己"修复了问题"——实际上它才是问题本身。这起事件在 Reddit 上引发大量讨论,也给所有依赖 AI Agent 辅助开发的人敲了一记响钟。 根据发帖者的复盘,当时他使用的...

小米招聘 Agent 上线:大模型如何重塑求职体验

来源:oschina.net 35
求职者最头疼的事,不是没有岗位,而是信息散、节点多、匹配难——政策藏在 FAQ 里,进度要反复刷页,简历投出去像石沉大海。小米这次上线的招聘 Agent,试图用一个对话窗口把这些问题叠在一起解决。 根据小米官方介绍,这个 Agent 依托自研的 Xiaomi MiMo 大模型,部署在小米招聘官网,核心能力有三层: 政策解答:校招时间线、薪酬福利、转岗规...

Azure Linux 4.0:微软终于有了自己的通用服务器 Linux

来源:infoq.com 28
在开源峰会上,微软宣布了两款新操作系统:Azure Linux 4.0 和 Azure Container Linux。前者意味着微软第一次提供面向通用服务器场景的 Linux 发行版——不再只是跑容器的底层宿主机,而是可以直接在 Azure VM 上承担工作负载的完整系统。后者则基于 Flatcar 构建了一个不可变的容器专用宿主系统。两条路线,两种...

扇出架构的慢请求不是故障:自适应 Hedged Request 如何把 p99 延迟砍掉 74%

来源:infoq.com 20
你监控每个服务的 p99 都在 200ms 以内,但网关层的 p99 却飙到 800ms——这不是监控出了问题,而是扇出架构里"慢但没挂"的请求在层层叠加。Prathamesh Bhope 在这篇文章里提出了一套自适应对冲请求(adaptive hedged request)方案:用 DDSketch 实时估算分位数决定何时发对冲请求,用滑动窗口应对分...

Ant Design Pro v6.0.2:AI 帮你把老项目升到最新版

来源:oschina.net 27
升级框架版本这件事,大多数开发者的体验是:改依赖、跑构建、修报错、再改依赖……循环往复,尤其跨多个大版本时,模板文件和配置结构都变了,手动合并几乎是一场灾难。Ant Design Pro v6.0.2 直接把这件事交给 AI 来做——新增 技能,自动对比最新模板并合并框架变更,任意版本跨度都能一步到位。 这次更新最值得关注的不是版本号本身,而是 这个能...