分类

文章

本地优先推理:让80%的文档零API成本完成提取

来源:infoq.com 19
处理4700份工程图纸PDF,API费用砍掉75%,处理时间缩短55%——这不是靠更便宜的模型,而是靠一个更聪明的路由策略:先把能确定性提取的文档留在本地处理,只把边缘情况交给云端大模型。Obinna Iheanachor 把这个实践总结为"Local-First AI Inference"架构模式,核心思路简单但效果显著。 文档处理场景里,大量内容是...

用标准堆出"无聊"系统:从 Java EE 到 Quarkus 再到 AI 时代的生存策略

来源:infoq.com 19
Adam Bien 在企业级 Java 圈里是个异类——他主张零依赖,坚持只用标准,并且把这种做法带来的系统称为"boring"(无聊的)。但这里的"无聊"不是贬义,而是指系统稳定、可预测、不需要天天救火。更关键的是,他靠这套策略让二十年前写的代码一路跑进了云时代,甚至天然适配今天的 AI-Native 场景。 这听起来像是在鼓吹保守主义,但背后有非常...

把 Kubernetes 升级从"吞时间怪兽"变成流水线

来源:cncf.io 22
Kubernetes 每年发布约三个小版本,每个版本的支持周期大约一年。这意味着你要么跟上节奏定期升级,要么冒险运行一个不再接收安全补丁的集群。现实是,很多团队每次升级都要花数周甚至数月——读 changelog、排查 API 废弃、逐个节点滚动、验证工作负载……升级本身成了工程时间的黑洞。 问题不在于 Kubernetes 太复杂,而在于我们把升级当...

企业 AI 从实验到规模化:治理、工作流与质量的三板斧

来源:openai.com 16
很多企业的 AI 之旅卡在同一个地方:PoC 漂亮,生产翻车。几周内跑出令人兴奋的 demo,却在面对合规审查、数据漂移、模型版本混乱时迅速失控。从早期实验走向持续产生复利效应的规模化 AI,核心不是买更多 GPU,而是把信任、治理、工作流设计、规模化质量这四根柱子先立起来。 "信任 AI"在企业语境下不是感性判断,而是每一条预测都能追溯到:谁批准了这...

OpenAI Campus Network:如何让高校社团真正用上 AI 工具

来源:openai.com 14
高校 AI 社团正在从"兴趣小组"走向"工程实战",但多数社团卡在同一个问题上——有想法,缺工具,更缺跨校协作的通道。OpenAI Campus Network 的推出,本质上是在补这块短板:把散落在各校的 AI 社团连成一张网,提供工具访问、活动支持和社区基础设施。 根据 OpenAI 公开的兴趣表单描述,Campus Network 的核心资源有三...

Netflix 用一张图管住上千个模型:Model Lifecycle Graph 实践解析

来源:infoq.com 22
当你的 ML 平台上跑着几百个模型、上千个特征、几十条数据管线时,一个最朴素的问题会变得极其棘手:这个模型用了哪份数据?那个特征被谁依赖?改了这条管线会炸掉谁? Netflix 的回答是——把一切画成一张图。 Netflix 最近公开了他们内部称为 Model Lifecycle Graph 的架构方案。核心思路并不复杂:用有向图把 dataset、f...

软件开发的第三种方式:当 AI 成为你的结对程序员

来源:ruanyifeng.com 20
软件开发的方式正在经历一次范式转移。过去我们熟悉两种路径——手写每一行代码的"工匠模式",和靠流程、测试、CI/CD 保驾护航的"工程化模式"。如今第三种方式正在成型:开发者不再逐行编写代码,而是通过意图描述让 AI 生成实现,人负责审查、修正和决策。这不是"让 AI 替你干活"的幻想,而是已经发生在日常开发中的真实变化。 第一种方式是个人英雄主义。一...

PostgreSQL JSONB 查询提速:生成列让文档字段回归关系模型

来源:postgr.es 15
存 JSONB 很爽——不用预定义 schema,不用频繁迁移表结构,几百 KB 的嵌套文档一条记录就能装下。但到了查询环节,事情就变了:按 过滤、按时间范围筛选、按 分类,这些再普通不过的操作在 JSONB 上跑起来既慢又容易写错索引。 核心矛盾很清晰:JSONB 的灵活性恰恰是查询性能的敌人。Postgres 对 JSONB 内部结构是"盲"的——...

OpenAI 推出 DeployCo:把前沿 AI 从实验室搬进生产线

来源:openai.com 32
OpenAI 刚宣布成立 DeployCo——一家专注于企业部署的新公司,目标只有一个:帮组织把前沿 AI 真正跑进生产环境,并且产出可衡量的业务结果。这不是又一个大模型发布会,而是 OpenAI 在"模型能跑"和"业务能用"之间搭的一座桥。 大多数企业买到了 API key,试了几个 prompt,就以为 AI 已经"上线"了。现实是:从 demo ...