标签

架构设计

Akka 2.10.18:十三年老牌 Actor 框架的又一次稳稳推进

来源:oschina.net 25
JVM 上做并发和分布式,Akka 几乎是绕不开的名字。从 2009 年第一个版本发布至今,这个受 Erlang 启发的 Scala 库已经持续维护了十三年。最近发布的 2.10.18 是一个典型的补丁版本——改动不大,但每一处都指向生产环境的稳定性。 2.10.18 的变更集中在两个方向: 依赖升级——Config 库从旧版本 bump 到 1.4....

古文字 OCR 终于有了统一考场:Chronicles-OCR 开源评测基准解析

来源:oschina.net 22
做现代汉字 OCR,随便拉一个开源模型就能跑出 95% 以上的准确率。但把同样的模型扔到甲骨文拓片上,识别率直接跌到不可用的程度——字形变异大、样本稀缺、标注门槛极高,古文字 OCR 长期处于"各家自建小数据集、互相无法对比"的碎片状态。Chronicles-OCR 的出现,第一次给这个领域搭了一个统一的考场。 Chronicles-OCR 最核心的卖...

用 AI Agent 把 Crash 分析从"人工排雷"变成"自动诊断"

来源:my.oschina.net 13
一线开发者对这套流程再熟悉不过:Crash 看板飘红 → 打开堆栈 → 看一眼觉得像内存问题 → 找对应模块负责人 → 对方说"我看看"→ 半天后回复"是第三方 SDK 的锅"→ 再拉 SDK 方排查 → 一轮下来半天没了。如果 Crash 量级大、版本多,专家基本被钉死在排查上,新功能迭代自然减速。 这篇文章讲的是:把这套依赖人的排查流程,交给一个结...

当 AI 需要长期记忆:为什么 PostgreSQL 正在成为企业记忆基础设施

来源:postgr.es 31
当前的 AI 基础设施讨论几乎被模型、GPU、推理速度和向量数据库占据。这些组件确实重要,但它们掩盖了一个更深的架构问题——随着企业从 AI 实验走向运营系统,这个问题正在快速浮现:记忆。 不是简单存储聊天记录或 embedding 的那种记忆,而是跨长时间交互中维持持久上下文、操作连续性、历史理解、工作流状态、推理可追溯性和业务感知的能力。大多数 A...

用实时学习排序重建搜索补全:Swiggy 在 OpenSearch 上的工程实践

来源:infoq.com 23
搜索补全(autocomplete)是外卖平台最敏感的交互环节——用户每敲一个字,系统就得在几十毫秒内返回最相关的建议。传统做法靠人工规则排序,规则越堆越难维护,效果也容易停滞。Swiggy 最近分享了他们在 OpenSearch 上搭建的实时 ML 排序系统:把候选生成和排序解耦,引入特征仓库供给实时信号,用学习排序(LTR)模型替代启发式规则,同时...

用 LLM Eval 做实验:漏斗而非一刀切

来源:engineering.atspotify.com 30
Spotify 工程团队最近分享了一个关于 LLM Eval 实验设计的核心观点:把 LLM 评估当成漏斗,而不是一刀切的闸门。 这句话看似简单,但背后指向的是很多团队在用 LLM 做自动评估时踩的坑——把 eval 当成 binary pass/fail 的裁判,结果要么放过了坏输出,要么误杀了好输出。 很多团队拿到 LLM eval 的第一反应是:...

Anthropic 发布托管 Agent、主动式工作流与能力阶梯曲线——Code with Claude 2026 要点与实践

来源:infoq.com 20
Anthropic 在旧金山举办的 "Code with Claude 2026" 活动上,一口气抛出三个方向性更新:托管 Agent 让开发者不再自己搭基础设施跑长任务;主动式工作流让 Claude 从"等指令"变成"推进度";能力阶梯曲线则试图把模型升级从模糊的"更强了"变成可预期的工程参数。GitHub、Vercel 和一批 AI-native ...

NumPy 2.4.5:补丁修复与类型改进,该升级吗?

来源:oschina.net 19
NumPy 2.4.5 作为 2.4 系列的补丁版本,合并了 28 个拉取请求,重点修复了 2.4.4 发布后暴露的 bug,并做了一批类型标注改进。如果你正在用 2.4.x,这次升级几乎零风险——补丁版本不引入新特性,只修问题。 此版本支持 Python 3.11 至 3.14。注意 Python 3.14 目前仍在预发布阶段,NumPy 已经提前适...

业务系统里的数据架构:不只是画 ER 图

来源:my.oschina.net 38
很多团队一提到"数据架构",就打开绘图工具画几张 ER 图,然后觉得任务完成了。实际上,从业务系统研发的视角看,数据架构要解决的问题远不止表结构设计——它决定了数据怎么产生、怎么流转、怎么存储、怎么被消费,以及当业务规模翻倍时,系统还能不能扛住。 本文聚焦业务系统研发视角的数据架构。如果站在数据平台的角度,数据架构还会涉及数据标准、数据质量等更广泛的治...