标签

AI

把 14 年歌单蒸馏成 AI 电台:个人品味如何注入大模型

来源:oschina.net 16
独立开发者 mmguo 做了一件很多人想过但没动手的事——把自己 14 年积累的歌单和审美判断,不是"导入",而是"蒸馏"进一个叫 Claudio 的 AI DJ 里。结果是一个真正懂你口味的私人电台:你说"下雨天想听点安静的",它不会给你推 Spotify 的全球热门慢歌,而是从你自己的审美坐标系里挑出那首你大概率会喜欢的曲子。 这件事的核心难题不是...

Rust 1.96.0:可 Copy 的 Range 类型与断言匹配宏,还有两个 Cargo 安全修复

来源:oschina.net 18
Rust 1.96.0 稳定版落地了。这次更新最值得动手试的是一套全新的 Range 类型——它们终于支持 ,迭代方式也从 切换到了 。此外新增的断言匹配宏让测试中的结构化断言更简洁,Cargo 也修补了两个安全相关问题。下面逐项拆开看。 旧版 (比如 )有个长期痛点:它实现了 ,但不支持 。这意味着你把一个 range 传给函数后再想用它,就得重新构...

Anthropic 拿下 650 亿美元 H 轮:估值逼近万亿,开发者该怎么看?

来源:oschina.net 20
Anthropic 刚刚宣布完成 650 亿美元的 H 轮融资,投后估值 9650 亿美元——这个数字已经把大多数上市科技公司甩在身后。更值得关注的是,公司年化收入突破 470 亿美元,说明 Claude 的商业化不是纸上谈兵。本轮融资由 Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capital 领投,...

用自然语言做故障演练:阿里开源 Blade AI 智能体,让混沌工程变成日常

来源:oschina.net 36
混沌工程的价值没人质疑,但真正坚持做故障演练的团队不多。原因很简单——一次完整的演练,从场景设计、参数计算、命令构造、执行观测到结果回收,动辄耗费半天。ChaosBlade 已经把故障注入的能力做得很全,但"人 → ChaosBlade"之间那段路,依然又长又陡。 阿里最近开源的 Blade AI,瞄准的就是这段路。它不是 ChaosBlade 的替代...

Arm 开源 Metis:用 RAG + Agent 把漏洞挖掘的命中率拉到新水位

来源:oschina.net 17
Arm 把内部安全研究团队打磨多年的漏洞发现框架 Metis 完全开源了。这不是又一个"AI 扫描器"的 demo——它在 Arm 内部 130 多个软件项目里已经跑出真阳性率提升 10 倍、误报降低 50% 的硬数据,并计划 2026 年底前覆盖 Arm 全系产品。对于做安全审计、代码扫描的工程师来说,这个架构值得拆开看一遍。 静态分析工具(Cove...

OpenAI 推出 Rosalind 生物防御计划:前沿 AI 如何进入公共卫生与防疫实战

来源:openai.com 12
OpenAI 正式发布 Rosalind Biodefense 项目,将此前内部使用的 GPT-Rosalind 模型向经过审核的开发者和美国政府合作伙伴开放。这标志着前沿 AI 从通用对话场景,正式进入生物防御、公共卫生和疫情准备这类高敏感、高门槛领域——模型能力不变,但访问机制、使用边界和合作方资质都截然不同。 生物防御场景的数据和处理逻辑有几个鲜...

VS Code 1.122:离线也能跑自己的大模型,浏览器里直接测响应式

来源:oschina.net 19
VS Code 1.122 把两件开发者高频要做的事推到了编辑器内部:一是用自己部署的大模型写代码,二是看页面在不同屏幕上的表现。前者通过 Air-gapped BYOK 让你断网也能调用本地模型,后者用浏览器设备模拟把"开 Chrome DevTools 切设备"的流程收进了 VS Code。再加上更丰富的问题报告机制,这个版本在"编辑器即工作台"这...

不再为 JSON 纠结:MySQL HeatWave Document Store 的混合之道

来源:blogs.oracle.com 21
用户画像、IoT 遥测、AI 提示词日志、商品目录——现代应用每天都在吞吐大量半结构化数据。这些数据天生带着 JSON 的灵活基因,字段随时增减,嵌套层级深浅不一,硬塞进严苛的关系型表结构里,往往意味着无休止的 和痛苦的 ORM 映射。 但另一方面,企业又很难彻底拥抱纯文档数据库。事务一致性、细粒度权限控制、成熟的运维生态,以及最关键的——对海量数据做...

Claude Opus 4.8:诚实度翻四倍,动态工作流初露锋芒

来源:oschina.net 18
Anthropic 刚放出旗舰模型的新一轮迭代——Claude Opus 4.8。编程、推理、agent 能力都有提升,但最值得工程师盯住的,是两个方向:自我审查能力带来的诚实度大幅改善,以及动态工作流的预览开放。价格没变,能力变了,这意味着现有 pipeline 可以直接升级,不用重新算成本。 模型"诚实"在 LLM 场景里不是道德口号,而是工程指标...

阶跃星辰开源 Step 3.7 Flash:196B 参数只激活 11B,Agent 场景的推理速度新标杆

来源:oschina.net 42
Agent 应用从 demo 走向生产,最大的拦路虎不是模型能力不够,而是推理太慢。多轮对话、工具调用、搜索反馈——每一轮都在等模型吐字,用户体感直接崩盘。阶跃星辰刚开源的 Step 3.7 Flash,用稀疏 MoE 把总参数推到 196B,但每步只激活 11B,换来最高 400 Tokens/s 的生成速度,瞄准的就是这个痛点。 Step 3.7 ...