标签

架构设计

CatchAdmin V5.3.1:打包不到10秒的 Laravel+Vue3 企业级后台框架

来源:oschina.net 35
每次启动新项目,后台系统总是最先让人头疼的部分。权限、菜单、动态路由、表格分页……这些基础设施写起来繁琐且重复,而前端一旦模块多了,Webpack 打包动辄几分钟的等待更是消磨耐心。CatchAdmin V5.3.1 的发布,直接从架构和工程化两个维度切入了这些痛点:底层升级到 Laravel 13.x 与 Vue3,前端生产环境打包时间压缩到了 10...

开源鸿蒙六年:从架构师视角看 OpenHarmony 6.x 的演进与实战

来源:my.oschina.net 17
在开源鸿蒙开发者大会 2026(OHDC 2026)主论坛上,OpenHarmony 总架构师、项目管理委员会主席任革林正式解读了 OpenHarmony 6.x Release 的新特性,并预发布了 6.1 LTS 版本。六年时间,一个从零起步的开源操作系统走到 LTS 阶段——这背后不只是版本号的递增,更是架构决策、生态策略和工程节奏的叠加结果。 ...

vivo 官网 AI 导购:从边界定义到多层架构的落地之路

来源:my.oschina.net 34
手机官网的购物场景有一个长期痛点:用户面对几十款机型、上百种配置组合,往往在参数对比页反复跳转,最终决策链路长、跳出率高。vivo 团队选择用 AI 导购来缩短这条链路——不是做一个"万能聊天机器人",而是先划定能力边界,再搭建多层架构,最后逐步落地到真实用户场景。整个过程值得任何想做垂直场景 AI 助手的团队参考。 很多 AI 产品失败的原因不是技术...

Arm 开源 Metis:用 RAG + Agent 把漏洞挖掘的命中率拉到新水位

来源:oschina.net 17
Arm 把内部安全研究团队打磨多年的漏洞发现框架 Metis 完全开源了。这不是又一个"AI 扫描器"的 demo——它在 Arm 内部 130 多个软件项目里已经跑出真阳性率提升 10 倍、误报降低 50% 的硬数据,并计划 2026 年底前覆盖 Arm 全系产品。对于做安全审计、代码扫描的工程师来说,这个架构值得拆开看一遍。 静态分析工具(Cove...

阶跃星辰开源 Step 3.7 Flash:196B 参数只激活 11B,Agent 场景的推理速度新标杆

来源:oschina.net 42
Agent 应用从 demo 走向生产,最大的拦路虎不是模型能力不够,而是推理太慢。多轮对话、工具调用、搜索反馈——每一轮都在等模型吐字,用户体感直接崩盘。阶跃星辰刚开源的 Step 3.7 Flash,用稀疏 MoE 把总参数推到 196B,但每步只激活 11B,换来最高 400 Tokens/s 的生成速度,瞄准的就是这个痛点。 Step 3.7 ...

roncoo-education v26.0.0:用 Spring Cloud 微服务搭一套在线教育系统,从架构到落地

来源:oschina.net 28
领课教育系统(roncoo-education)刚发布了 v26.0.0。这个项目不是又一个"脚手架 demo",而是从领课网络多年真实运营的在线教育平台中提炼出来的产品——课程点播、视频云对接、附件管理这些功能,都是踩过坑后才定下来的设计。如果你正在评估或搭建在线教育平台,它提供了一个可直接参考的微服务落地方案。 系统采用前后端分离模式: 前台:以 ...

用 React + Flask 反向代理嵌入 SageMaker MLflow,搭一个带 SigV4 鉴权的自定义实验追踪门户

来源:aws.amazon.com 25
SageMaker AI 现在支持托管 MLflow Server,但默认的访问方式要么走 SageMaker Studio 内部,要么依赖 AWS IAM 策略直接暴露端点——两者都不适合直接面向团队内部的非 AWS 用户。这篇文章给出了一套完整方案:React 前端嵌入 MLflow UI,Flask 反向代理自动签注 SigV4 请求,整栈用 C...

从代码补全到任务执行:Dropbox 如何重构 AI 时代的工程生产力

来源:dropbox.tech 18
代码补全、智能搜索、自然语言查错——这些 AI 辅助工具已经渗透进大多数工程师的日常。但 Dropbox 的工程团队正在推进一个更激进的转向:不再把 AI 当作"帮人写代码的助手",而是构建能够独立执行有边界任务的 agentic 系统,并为此搭建支撑平台。这意味着工程生产力的定义本身正在被重写。 辅助工具的交互模型是"人提问,AI 回答"。工程师写一...

Slack AI 的多云之路:在企业级规模下可靠地服务大模型

来源:slack.engineering 29
2023 年初,Slack 面对一个底层问题:如何在企业级规模上服务大语言模型,同时满足客户对安全、可靠性和性能的预期。三年间,他们从最基础的基础设施起步,逐步演进到一套成熟的多云编排架构。这不是追逐新模型的炫技,而是要构建一个能抵御区域级故障、在云厂商之间灵活调度的系统。 LLM 推理的负载特征和传统 Web 服务截然不同——单次请求耗 GPU 算力...

扇出架构的慢请求不是故障:自适应 Hedged Request 如何把 p99 延迟砍掉 74%

来源:infoq.com 20
你监控每个服务的 p99 都在 200ms 以内,但网关层的 p99 却飙到 800ms——这不是监控出了问题,而是扇出架构里"慢但没挂"的请求在层层叠加。Prathamesh Bhope 在这篇文章里提出了一套自适应对冲请求(adaptive hedged request)方案:用 DDSketch 实时估算分位数决定何时发对冲请求,用滑动窗口应对分...