标签

LLM

Qoder 1.0:从 AI 编辑器到智能体开发工作台,阿里把"自动驾驶"搬进了工程流程

来源:oschina.net 25
阿里把 Qoder 从一个 IDE 内的 AI 辅助模式,做成了独立运行的智能体开发工作台。核心变化只有一个:开发者不再逐行指挥 AI 写代码,而是定义需求,让一组 Agent 自主完成从执行、验证到交付的全流程。听起来像把 CI/CD 管线的前半段交给了 AI——但这次管线里跑的不是脚本,是能做决策的 Agent。 之前 Quest 是 IDE 里的...

Kimi WebBridge:把你的浏览器交给 AI Agent 来操作

来源:oschina.net 30
月之暗面刚发布的 Kimi WebBridge,解决了一个长期卡住 AI Agent 生态的问题——AI 能生成代码、能调用 API,但一旦需要操作需要登录的网页,就束手无策。WebBridge 让 AI 带着你的登录态去点击、输入、提取信息,相当于给 Agent 发了一张你的浏览器"通行证"。 大部分有价值的网页操作都发生在登录之后:提交 JIRA ...

ChatGPT 个人理财功能:把 AI 变成你的财务顾问

来源:openai.com 17
OpenAI 刚向美国 Pro 用户推出了一项新功能——在 ChatGPT 中直接连接你的银行、信用卡、投资等金融账户,让 AI 基于你的真实财务数据给出洞察和建议。不再是泛泛而谈的"建议你多存钱",而是"你这个月在餐饮上花了 37% 的收入,比上月涨了 12%,你的储蓄目标会因此推迟两周"。 过去用 ChatGPT 问理财问题,你得手动输入一堆数字:...

GPT-5.5 刷新 OfficeQA Pro 记录,Databricks 把它塞进企业 Agent 工作流

来源:openai.com 27
GPT-5.5 在 OfficeQA Pro 基准上拿下了新的最高分,Databricks 随即宣布将其接入企业级 Agent 工作流。这件事的意义不在于分数本身——OfficeQA Pro 测试的是模型在真实办公场景下处理多步骤、多文档、多工具协作问题的能力,而这恰好是企业 Agent 最吃力的地方。分数刷新说明模型底座够硬,Databricks 的...

用 Codex 把业务运营文档从"手写苦力"变成"自动流水线"

来源:openai.com 18
业务运营团队每天要产出一堆文档——项目简报、战略更新、领导决策包、进度汇报……这些内容本质上是对已有工作素材的提炼和重组,但偏偏占去了大量人力。OpenAI 的 Codex 正好擅长这类"从真实输入生成结构化输出"的任务。本文拆解几个典型场景,并给出可直接跑的自动化脚本。 一个中型公司的业务运营团队,每周至少要处理这些交付物: 交付物 输入来源 当前做...

用 Codex 把数据科学团队的日常产出自动化

来源:openai.com 33
数据科学团队最耗时间的往往不是建模本身,而是围绕模型和数据的那一堆"沟通文档"——根因分析简报、影响评估报告、KPI 备忘录、范围界定文档、看板需求规格。这些产出格式固定、逻辑重复,却每次都要人手写。OpenAI 的 Codex 把这类工作变成了可编排的自动化流程:给它原始数据和工作上下文,它就能直接生成结构化的分析文档。 下面拆解五个典型场景,并给出...

用 Codex 把销售杂活变成可复用的流水线

来源:openai.com 25
销售团队每天要处理大量重复性文档——管线简报、会前准备包、预测复盘、客户规划、停滞订单诊断。这些工作内容高度结构化,却总是靠人工从 CRM、邮件、通话记录里拼凑,耗时且容易遗漏关键信息。Codex 的能力恰好匹配这类需求:从真实工作输入中提取要点,按固定模板生成可交付的文档。 Codex 在销售场景的核心用法可以归结为一句话:把散落在各处的原始素材,按...

Sea 为什么把 Codex 推进全部工程团队:Agentic 开发在东南亚的落地逻辑

来源:openai.com 22
Sea Limited 旗下有 Shopee、Garena、SeaMoney 三条业务线,工程师规模庞大,产品迭代节奏极快。CPO 近期公开表态:正在把 Codex 部署到各工程团队,推进 AI-native 的软件开发方式。这不是"试点几个小组写写 Copilot",而是把 agentic coding 当作工程基础设施的一部分来建设。 背后的判断很...

用 Stream Vision Agents 和 Amazon Nova 2 Sonic 搭建实时语音 Agent

来源:aws.amazon.com 20
语音交互正在从"演示级玩具"走向"生产级产品"。过去搭一个实时语音 Agent,你要自己搞定 WebSocket 管理、音频流缓冲、VAD(语音活动检测)、TTS/STT 编排、断线重连……光基础设施就够写一个月。Stream 的 Vision Agents 开源框架把这套管线标准化了,再配上 Amazon Bedrock 上的 Nova 2 Soni...

用 Chrome 企业策略给 AI 浏览器 Agent 画一道"围栏"

来源:aws.amazon.com 14
当 AI Agent 拿到浏览器权限,它可以去任何网站——这对企业来说是个不可接受的风险。Amazon Bedrock AgentCore 现在支持将 Chrome 企业策略注入浏览器会话,让你精确控制 Agent 能访问哪些域名、能否下载文件、是否允许执行 JavaScript。本文演示如何配置这些策略、通过会话录制验证策略生效,以及如何注入自定义根...