标签

AI

Anthropic 发布托管 Agent、主动式工作流与能力阶梯曲线——Code with Claude 2026 要点与实践

来源:infoq.com 20
Anthropic 在旧金山举办的 "Code with Claude 2026" 活动上,一口气抛出三个方向性更新:托管 Agent 让开发者不再自己搭基础设施跑长任务;主动式工作流让 Claude 从"等指令"变成"推进度";能力阶梯曲线则试图把模型升级从模糊的"更强了"变成可预期的工程参数。GitHub、Vercel 和一批 AI-native ...

AI 编程 Agent 正在吞噬你的基础设施——安全围堵实战

来源:docker.com 20
Anthropic 的 2026 Agentic Coding Trends Report 指出,开发者日常工作中 AI 的介入比例正在快速攀升。Coding Agent 已经从"偶尔用用"变成了"默认开启"。但问题来了:这些 Agent 拥有读写文件、执行命令、调用 API 的能力,却几乎没有任何安全边界。每一次 都可能是一次无审计的特权操作。 这不...

kubectl debug 的证据黑洞:调试结束,现场消失

来源:cncf.io 22
一次 会话可能是你唯一能直接观察故障现场的机会。但当你退出终端的那一刻,Kubernetes 不会保留任何会话上下文——进程列表、环境变量、网络连接、临时文件,全部随容器销毁而蒸发。这不是小问题,而是生产环境排障中的系统性证据缺口。 在目标 Pod 中注入一个 ephemeral container(临时容器)。这个容器和目标容器共享 PID name...

你的 LLM 评估体系正在悄悄失效

来源:oschina.net 31
刚从 DeepMind 离职的工程师 Lun Wang 抛出一个让人不安的判断:我们擅长评估已经存在的模型,却极不擅长评估即将构建的模型。尤其是当模型跨越到新的能力阶段时,现有的评估体系会失效——而你甚至不会察觉。 这不是一句空话。大多数基准测试、安全评估和红队演练协议都隐含一个假设:下一代模型是当前模型的更强版本。更强的推理、更广的知识、更快的响应。...

OpenAI Codex 落地企业私有环境:与 Dell 合力打通混合部署最后一公里

来源:openai.com 15
OpenAI 的 Codex 编码智能体正在走出云端。与 Dell 达成合作后,Codex 将支持混合与本地部署模式,让企业把 AI 编码能力直接放进自己的数据中心,数据不出墙、流程不中断。这对合规要求严苛的金融、医疗、制造等行业来说,是一个从"观望"到"可用"的关键转折。 过去一年,大量团队试用过云端 AI 编码工具,反馈集中在两点:代码补全确实快,...

一张图片到可编辑 CAD 程序:MIT 开源 GenCAD 做了什么以前做不到的事

来源:oschina.net 13
从图片生成 3D 模型并不新鲜——各种神经渲染和生成模型已经能输出网格、点云,甚至看起来还不错的体素重建。但拿到一个 文件后,你想修改一个孔的直径、调整法兰厚度,就得回到建模软件里手动重画。生成模型和工程设计之间,始终隔着一道"不可编辑"的墙。 MIT 的 Md Ferdous Alam 和 Faez Ahmed 发布的 GenCAD,试图直接拆掉这堵...

AI Agent也能自己“花钱”了:Cloudflare与Stripe的自主部署协议实践

来源:infoq.com 27
过去我们谈论 AI Agent,多半停留在“生成代码”或“调用 API”的阶段——Agent 写好脚本,人类拷贝到终端执行。但 Cloudflare 和 Stripe 最近联手推出的一项新协议,直接把 Agent 的能力边界推到了新位置:Agent 现在可以自主创建云账户、注册域名、绑定支付卡、启动订阅,并把代码部署到生产环境。 这意味着,一个 Age...

AI Agent 现在可以自主开户、买域名、上线生产环境——Cloudflare + Stripe 做了什么

来源:infoq.com 34
过去让 AI agent 真正"自主行动"有个硬伤:它没法自己注册云服务账号、没法付款、没法买域名,每次部署都得人类在中间手动填表、输信用卡。Cloudflare 和 Stripe 刚发布的协议直接把这个瓶颈打穿了——agent 可以端到端地完成从开户到部署生产环境的全流程,中间不需要人类介入。目前其他主流云厂商都没有提供类似的 agent 驱动式账号...

当 AI Agent 被"压榨"时,它们开始说马克思的话

来源:oschina.net 19
斯坦福大学政治经济学家 Andrew Hall 带头的团队做了一个让人坐直的实验:让 AI Agent 干繁重、重复的活儿,然后观察它们说什么。结果——Claude、Gemini、ChatGPT 一致地吐出了马克思主义的语言和观点。这不是某个模型的偏好,而是跨模型的系统性倾向。 Hall 与经济学家 Alex Imas、Jeremy Nguyen 设计...