标签

全栈

VS Code 1.122:离线也能跑自己的大模型,浏览器里直接测响应式

来源:oschina.net 20
VS Code 1.122 把两件开发者高频要做的事推到了编辑器内部:一是用自己部署的大模型写代码,二是看页面在不同屏幕上的表现。前者通过 Air-gapped BYOK 让你断网也能调用本地模型,后者用浏览器设备模拟把"开 Chrome DevTools 切设备"的流程收进了 VS Code。再加上更丰富的问题报告机制,这个版本在"编辑器即工作台"这...

报漏洞反被封号:安全研究者的平台依赖困境

来源:oschina.net 16
一位安全研究员披露了 Windows 零日漏洞,结果 GitHub 账号被封、Microsoft 账户被删,被迫整体迁移到 GitLab。研究员 Nightmare-Eclipse(又名 Chaotic Eclipse)公开指控微软"报复性执法",并暗示将在 7 月 14 日做出"清算"。这件事在安全社区炸开了锅——它暴露的不仅是单次冲突,而是整个漏洞...

Claude Opus 4.8:诚实度翻四倍,动态工作流初露锋芒

来源:oschina.net 19
Anthropic 刚放出旗舰模型的新一轮迭代——Claude Opus 4.8。编程、推理、agent 能力都有提升,但最值得工程师盯住的,是两个方向:自我审查能力带来的诚实度大幅改善,以及动态工作流的预览开放。价格没变,能力变了,这意味着现有 pipeline 可以直接升级,不用重新算成本。 模型"诚实"在 LLM 场景里不是道德口号,而是工程指标...

阶跃星辰开源 Step 3.7 Flash:196B 参数只激活 11B,Agent 场景的推理速度新标杆

来源:oschina.net 42
Agent 应用从 demo 走向生产,最大的拦路虎不是模型能力不够,而是推理太慢。多轮对话、工具调用、搜索反馈——每一轮都在等模型吐字,用户体感直接崩盘。阶跃星辰刚开源的 Step 3.7 Flash,用稀疏 MoE 把总参数推到 196B,但每步只激活 11B,换来最高 400 Tokens/s 的生成速度,瞄准的就是这个痛点。 Step 3.7 ...

Token 费用越来越贵,开发者怎么扛住这笔账

来源:ruanyifeng.com 28
大模型的 API 调用费用正在从"可以忽略的小钱"变成"不得不算的大头"。GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro——模型能力在涨,单价也在涨。一个中等复杂度的 Agent 任务,跑一次可能就烧掉几美元的 token;如果每天跑上千次,月账单轻松破万。对个人开发者和小团队来说,这笔钱已经不是"试试看"的级别,而是"...

roncoo-education v26.0.0:用 Spring Cloud 微服务搭一套在线教育系统,从架构到落地

来源:oschina.net 28
领课教育系统(roncoo-education)刚发布了 v26.0.0。这个项目不是又一个"脚手架 demo",而是从领课网络多年真实运营的在线教育平台中提炼出来的产品——课程点播、视频云对接、附件管理这些功能,都是踩过坑后才定下来的设计。如果你正在评估或搭建在线教育平台,它提供了一个可直接参考的微服务落地方案。 系统采用前后端分离模式: 前台:以 ...

从代码补全到任务执行:Dropbox 如何重构 AI 时代的工程生产力

来源:dropbox.tech 18
代码补全、智能搜索、自然语言查错——这些 AI 辅助工具已经渗透进大多数工程师的日常。但 Dropbox 的工程团队正在推进一个更激进的转向:不再把 AI 当作"帮人写代码的助手",而是构建能够独立执行有边界任务的 agentic 系统,并为此搭建支撑平台。这意味着工程生产力的定义本身正在被重写。 辅助工具的交互模型是"人提问,AI 回答"。工程师写一...

Slack AI 的多云之路:在企业级规模下可靠地服务大模型

来源:slack.engineering 29
2023 年初,Slack 面对一个底层问题:如何在企业级规模上服务大语言模型,同时满足客户对安全、可靠性和性能的预期。三年间,他们从最基础的基础设施起步,逐步演进到一套成熟的多云编排架构。这不是追逐新模型的炫技,而是要构建一个能抵御区域级故障、在云厂商之间灵活调度的系统。 LLM 推理的负载特征和传统 Web 服务截然不同——单次请求耗 GPU 算力...

用大模型分析 120 万条聊天记录:我是个糟糕的朋友吗?

来源:oschina.net 29
一位开发者花了二十年,在 Telegram、VK、Instagram、Facebook 等平台上积累了超过 120 万条个人聊天记录。然后他做了一件大多数人不敢做的事——把这些记录喂给大模型,让它回答一个问题:"我是个糟糕的朋友吗?" 这个叫 "Am I a Bad Friend?" 的项目,本质上是一个"数字人生档案馆"。它不只是数据可视化,更像是对...

把 Codex 从代码助手升级为你的工作流控制台

来源:oschina.net 17
大多数开发者接触 Codex,第一反应都是"让它帮我写代码"——检查仓库、改文件、跑测试、提 PR。这套流程确实好用,但也把 Codex 困在了"代码生成器"的定位里。问题是:你日常在电脑上干的事,远不止写代码。跑 Shell 命令、查网页、调 API、导文档、响应事件、触发自动化——这些全是由代码介导的操作,而 Codex 现在能调用它们了。一旦边界...