标签

全栈

mayfly-go v1.11.2:文件上传可取消、终端支持右键粘贴,运维管控再打磨

来源:oschina.net 21
日常运维中,管机器和管数据库往往分散在不同工具里——SSH 终端连 Linux,Navicat 或 DBeaver 看数据库,权限审批还得另走流程。mayfly-go 把这两件事收进一个平台:Linux 机器的终端、文件管理,以及 MySQL/PostgreSQL/Redis 等数据库的连接与脚本执行,统一在一个 Web 界面里完成,权限、操作日志一并...

用 LLM Eval 做实验:漏斗而非一刀切

来源:engineering.atspotify.com 31
Spotify 工程团队最近分享了一个关于 LLM Eval 实验设计的核心观点:把 LLM 评估当成漏斗,而不是一刀切的闸门。 这句话看似简单,但背后指向的是很多团队在用 LLM 做自动评估时踩的坑——把 eval 当成 binary pass/fail 的裁判,结果要么放过了坏输出,要么误杀了好输出。 很多团队拿到 LLM eval 的第一反应是:...

Anthropic 发布托管 Agent、主动式工作流与能力阶梯曲线——Code with Claude 2026 要点与实践

来源:infoq.com 20
Anthropic 在旧金山举办的 "Code with Claude 2026" 活动上,一口气抛出三个方向性更新:托管 Agent 让开发者不再自己搭基础设施跑长任务;主动式工作流让 Claude 从"等指令"变成"推进度";能力阶梯曲线则试图把模型升级从模糊的"更强了"变成可预期的工程参数。GitHub、Vercel 和一批 AI-native ...

Bambu Lab 多次违反开源许可证,知名 YouTuber 彻底弃用

来源:oschina.net 16
Jeff Geerling——树莓派和 3D 打印圈子里拥有百万订阅的 YouTuber——最近发了一则声明:他已彻底弃用 Bambu Lab 的 3D 打印机。这不是一时冲动。早在 2025 年他就公开表示"可能不会再推荐任何 Bambu Lab 打印机",但后续发生的事让他把"可能"变成了"确定"。 核心原因:Bambu Lab 多次违反开源许可证...

原生 iOS 开发二十年,复杂文本处理为何还是 Web 技术更靠谱?

来源:oschina.net 23
一位写了近二十年 macOS/iOS 原生代码的开发者,最近得出一个让 Apple 生态开发者不太舒服的结论:在复杂文本处理场景下,Electron 等 Web 技术反而比 Apple 原生框架更可靠。Artem Loenko 把这段从信心满满到被迫转向的经历写在了博客上——他原本要在纯 Swift/SwiftUI 应用里实现一个支持 Markdown...

你的 LLM 评估体系正在悄悄失效

来源:oschina.net 31
刚从 DeepMind 离职的工程师 Lun Wang 抛出一个让人不安的判断:我们擅长评估已经存在的模型,却极不擅长评估即将构建的模型。尤其是当模型跨越到新的能力阶段时,现有的评估体系会失效——而你甚至不会察觉。 这不是一句空话。大多数基准测试、安全评估和红队演练协议都隐含一个假设:下一代模型是当前模型的更强版本。更强的推理、更广的知识、更快的响应。...

一张图片到可编辑 CAD 程序:MIT 开源 GenCAD 做了什么以前做不到的事

来源:oschina.net 13
从图片生成 3D 模型并不新鲜——各种神经渲染和生成模型已经能输出网格、点云,甚至看起来还不错的体素重建。但拿到一个 文件后,你想修改一个孔的直径、调整法兰厚度,就得回到建模软件里手动重画。生成模型和工程设计之间,始终隔着一道"不可编辑"的墙。 MIT 的 Md Ferdous Alam 和 Faez Ahmed 发布的 GenCAD,试图直接拆掉这堵...

AI Agent也能自己“花钱”了:Cloudflare与Stripe的自主部署协议实践

来源:infoq.com 27
过去我们谈论 AI Agent,多半停留在“生成代码”或“调用 API”的阶段——Agent 写好脚本,人类拷贝到终端执行。但 Cloudflare 和 Stripe 最近联手推出的一项新协议,直接把 Agent 的能力边界推到了新位置:Agent 现在可以自主创建云账户、注册域名、绑定支付卡、启动订阅,并把代码部署到生产环境。 这意味着,一个 Age...

AI Agent 现在可以自主开户、买域名、上线生产环境——Cloudflare + Stripe 做了什么

来源:infoq.com 34
过去让 AI agent 真正"自主行动"有个硬伤:它没法自己注册云服务账号、没法付款、没法买域名,每次部署都得人类在中间手动填表、输信用卡。Cloudflare 和 Stripe 刚发布的协议直接把这个瓶颈打穿了——agent 可以端到端地完成从开户到部署生产环境的全流程,中间不需要人类介入。目前其他主流云厂商都没有提供类似的 agent 驱动式账号...