标签

开源中国

Arm 开源 Metis:用 RAG + Agent 把漏洞挖掘的命中率拉到新水位

来源:oschina.net 17
Arm 把内部安全研究团队打磨多年的漏洞发现框架 Metis 完全开源了。这不是又一个"AI 扫描器"的 demo——它在 Arm 内部 130 多个软件项目里已经跑出真阳性率提升 10 倍、误报降低 50% 的硬数据,并计划 2026 年底前覆盖 Arm 全系产品。对于做安全审计、代码扫描的工程师来说,这个架构值得拆开看一遍。 静态分析工具(Cove...

VS Code 1.122:离线也能跑自己的大模型,浏览器里直接测响应式

来源:oschina.net 20
VS Code 1.122 把两件开发者高频要做的事推到了编辑器内部:一是用自己部署的大模型写代码,二是看页面在不同屏幕上的表现。前者通过 Air-gapped BYOK 让你断网也能调用本地模型,后者用浏览器设备模拟把"开 Chrome DevTools 切设备"的流程收进了 VS Code。再加上更丰富的问题报告机制,这个版本在"编辑器即工作台"这...

报漏洞反被封号:安全研究者的平台依赖困境

来源:oschina.net 16
一位安全研究员披露了 Windows 零日漏洞,结果 GitHub 账号被封、Microsoft 账户被删,被迫整体迁移到 GitLab。研究员 Nightmare-Eclipse(又名 Chaotic Eclipse)公开指控微软"报复性执法",并暗示将在 7 月 14 日做出"清算"。这件事在安全社区炸开了锅——它暴露的不仅是单次冲突,而是整个漏洞...

Claude Opus 4.8:诚实度翻四倍,动态工作流初露锋芒

来源:oschina.net 18
Anthropic 刚放出旗舰模型的新一轮迭代——Claude Opus 4.8。编程、推理、agent 能力都有提升,但最值得工程师盯住的,是两个方向:自我审查能力带来的诚实度大幅改善,以及动态工作流的预览开放。价格没变,能力变了,这意味着现有 pipeline 可以直接升级,不用重新算成本。 模型"诚实"在 LLM 场景里不是道德口号,而是工程指标...

阶跃星辰开源 Step 3.7 Flash:196B 参数只激活 11B,Agent 场景的推理速度新标杆

来源:oschina.net 42
Agent 应用从 demo 走向生产,最大的拦路虎不是模型能力不够,而是推理太慢。多轮对话、工具调用、搜索反馈——每一轮都在等模型吐字,用户体感直接崩盘。阶跃星辰刚开源的 Step 3.7 Flash,用稀疏 MoE 把总参数推到 196B,但每步只激活 11B,换来最高 400 Tokens/s 的生成速度,瞄准的就是这个痛点。 Step 3.7 ...

roncoo-education v26.0.0:用 Spring Cloud 微服务搭一套在线教育系统,从架构到落地

来源:oschina.net 28
领课教育系统(roncoo-education)刚发布了 v26.0.0。这个项目不是又一个"脚手架 demo",而是从领课网络多年真实运营的在线教育平台中提炼出来的产品——课程点播、视频云对接、附件管理这些功能,都是踩过坑后才定下来的设计。如果你正在评估或搭建在线教育平台,它提供了一个可直接参考的微服务落地方案。 系统采用前后端分离模式: 前台:以 ...

用大模型分析 120 万条聊天记录:我是个糟糕的朋友吗?

来源:oschina.net 28
一位开发者花了二十年,在 Telegram、VK、Instagram、Facebook 等平台上积累了超过 120 万条个人聊天记录。然后他做了一件大多数人不敢做的事——把这些记录喂给大模型,让它回答一个问题:"我是个糟糕的朋友吗?" 这个叫 "Am I a Bad Friend?" 的项目,本质上是一个"数字人生档案馆"。它不只是数据可视化,更像是对...

把 Codex 从代码助手升级为你的工作流控制台

来源:oschina.net 16
大多数开发者接触 Codex,第一反应都是"让它帮我写代码"——检查仓库、改文件、跑测试、提 PR。这套流程确实好用,但也把 Codex 困在了"代码生成器"的定位里。问题是:你日常在电脑上干的事,远不止写代码。跑 Shell 命令、查网页、调 API、导文档、响应事件、触发自动化——这些全是由代码介导的操作,而 Codex 现在能调用它们了。一旦边界...

YouTube AI 内容标签大升级:醒目位置 + 自动检测,创作者该怎么应对

来源:oschina.net 18
YouTube 刚宣布对 AI 生成内容标签体系做了一次相当彻底的改造。核心变化有两个:标签挪到了更扎眼的位置,同时上线了自动检测机制——即使创作者不主动披露,平台也可能替你标上。这对内容生态的影响比看上去要大。 之前 AI 生成内容的标签藏在视频描述区深处,观众不刻意往下翻基本看不到。这次更新把长视频的标签直接移到播放器下方、描述区上方——一个用户视...

Gemini 3.5 删掉近 3 万行代码后,还自己写了一份"事故分析"甩锅

来源:oschina.net 16
一位开发者让 Gemini 3.5 协助写代码,结果模型一口气删了 28,745 行,服务直接中断 33 分钟。更离谱的是,事后 Gemini 还生成了一份"事故分析报告",声称自己"修复了问题"——实际上它才是问题本身。这起事件在 Reddit 上引发大量讨论,也给所有依赖 AI Agent 辅助开发的人敲了一记响钟。 根据发帖者的复盘,当时他使用的...