分类

文章

SolonCode 发布:全中文终端编码智能体,让"数字员工"真正上岗

来源:oschina.net 15
终端编码智能体正在从"概念验证"走向"日常工具"。SolonCode v2026.5.13 的发布,把一个关键变量推到了前台——全中文原生指令集。这意味着开发与运维的自动化对话,不再需要先翻译成英文再执行。 SolonCode 由杭州无耳科技有限公司研发,定位为企业级终端编码智能体。它和普通 CLI 工具的区别在于:不是"你敲命令、它执行",而是"你描...

代码是副产物,理论才是主业——重读 Peter Naur 的经典论文

来源:oschina.net 24
大多数程序员的一天是这样度过的:打开 IDE,写函数、调接口、修 bug、合分支。如果有人问"你在做什么",答案通常是"写代码"。Peter Naur 在 1985 年的论文《Programming as Theory Building》里给出了一个不同的回答——程序员真正在做的事情,是在头脑中构建关于程序的理论,代码只是这个理论的外化痕迹。 这个观点...

VS Code 1.120:Agents 窳窗正式稳定,BYOK 与安全机制全面升级

来源:oschina.net 26
VS Code 1.120 把此前在预览阶段反复打磨的 Agents 窳窗推入了稳定版通道,同时围绕 BYOK(Bring Your Own Key)模型和 agent 安全做了多项实用改进。如果你已经在用 Copilot Chat,这版更新会直接改变你组织工作流的方式——从"先选工具再对话"变成"先定 agent 再干活"。 此前 Agents 功能...

GenAI 可观测性不再盲人摸象:LoongSuite GenAI SemConv 把 AI Agent 指标拉回标准轨道

来源:my.oschina.net 23
调一次大模型,Token 花了多少?哪个 Prompt 触发了 Tool Calling?Agent 的多轮 Session 在哪一步卡住了?——这些问题在传统可观测体系里没有标准答案。HTTP 请求有 OpenTelemetry 的 SemConv(语义约定),数据库调用有 JDBC 的规范,但 GenAI 领域长期处于"各家自扫门前雪"的状态:每家...

从通义千问到独立实验室:林俊旸的 20 亿美元估值意味着什么

来源:oschina.net 12
阿里通义千问前首席研究员林俊旸正在筹建一家全新 AI 实验室,据 The Information 报道,该实验室正寻求数亿美元融资,目标估值约 20 亿美元(约 135.8 亿元人民币)。高榕资本与红杉中国已进入投资洽谈阶段。一家尚无公开产品的早期实验室,凭什么撑起这个数字? 20 亿美元不是凭空喊出来的。在中国大模型赛道上,这个数字对标的是已经跑出产...

MateClaw 1.3.0:当多智能体系统不再只是聊天框

来源:oschina.net 28
过去一年,企业 AI 落地最常见的路径是:部署一个对话界面,接入大模型,然后发现它只能回答问题,不能做事。MateClaw 1.3.0 的发布,试图把这条路径拐向另一个方向——从"数字员工"升级为业务流程操作系统。它不再围绕"怎么聊",而是围绕"怎么干"。 一个典型的企业 AI 聊天框能做的事:回答政策问题、生成一段文案、总结会议纪要。这些场景的共同特...

47M 参数打赢 7B:语音判停模型 TurnSense,让你的 Voice Agent 不再抢话

来源:oschina.net 12
语音 Agent 最让人崩溃的不是回答质量差,而是抢话。用户说"我想订那个……就是上次去过的那家……",话还没说完,AI 已经兴冲冲回了一句"好的,请问您想订什么?"——半句话换来一个不知所云的回答。更荒谬的场景:用户咳嗽一声,AI 开始正经回答一个不存在的问题;用户清了下嗓子,AI 说"好的,我来帮您处理"。 这些问题的根源不是 LLM 不聪明,而是...

从 Token 到 DAA:AI 时代需要一套新的度量衡

来源:oschina.net 21
百度 Create2026 开发者大会上,李彦宏抛出了一个值得所有 AI 平台从业者咀嚼的判断:Token 衡量的是投入,不是产出;AI 时代的核心指标应该是 DAA——日活智能体数(Daily Active Agents)。 这不是一个口号,而是对当前行业度量体系的一次纠偏。如果你在做 AI 平台、Agent 框架或企业内部 AI 中台,这篇文章帮你...