标签

AI

Slack 用意图驱动的 AI Agent 缓解端到端测试脆弱性

2026-07-10 来源: infoq.com 27

Slack 工程团队提出了一种 Agentic Testing 思路：端到端测试不再完全依赖固定选择器和逐步脚本，而是让 AI Agent 根据测试意图观察界面、执行操作，并在运行时适应 UI 或系统变化。它瞄准的是分布式系统中长期存在的难题：页面只改了结构或文案，业务能力仍然正常，测试却先红了。这并不意味着用 AI 替换所有自动化测试。更合理的定位...

# AI # InfoQ # LLM

阅读全文

从固定脚本到意图执行：Slack 的 Agent 驱动 E2E 测试思路

2026-07-10 来源: infoq.com 31

Slack 工程团队提出了一种 Agentic Testing 思路：让 AI Agent 根据测试意图执行端到端工作流，而不是机械地重放一串固定选择器。它关注的不是“点击第三个按钮”，而是“完成登录并确认工作区首页可用”。当按钮位置、DOM 层级或部分文案变化时，Agent 可以在运行时重新判断下一步动作，从而降低 UI 自动化测试的脆弱性。这并不...

# AI # InfoQ # LLM

阅读全文

用规格增强与 LLM 裁判构建可评估的智能体工作流

2026-07-10 来源: realpython.com 41

现代智能体系统的问题往往不在于模型“不会回答”，而在于任务定义含糊、执行过程不可检查、最终结果缺少稳定的验收标准。围绕智能体架构的构建与评估，一个实用方向是把工作流拆成两类明确职责：先通过规格增强补全任务，再让独立的 LLM 裁判依据量表评估结果。这不是简单地多调用几次模型。规格、执行和评审必须拥有清晰的数据边界，否则系统只是在反复生成措辞不同、质量...

# AI # LLM # Python

阅读全文

Linux Foundation 启动 Akrites：为关键开源软件建立 AI 威胁防线

2026-07-10 来源: infoq.com 41

Linux Foundation 启动了 Akrites，一项面向全行业的新计划，目标是保护全球关键开源软件，应对快速演进的 AI 驱动型网络威胁。现有公开摘要并未披露 Akrites 的具体工具、治理结构或接入方式，但它传递了一个清晰信号：开源安全正在进入攻击自动化与防御协作同时加速的新阶段。 AI 并没有让依赖混淆、凭据泄露、恶意提交和供应链投毒这...

# AI # InfoQ # 全栈

阅读全文

GitHub Copilot CLI 新终端界面：多标签会话与免配置文件工具接入

2026-07-10 来源: infoq.com 32

GitHub Copilot CLI 重新设计的终端界面已经正式可用。这次变化不只是视觉翻新：新界面用标签页组织会话、Gist、Issue 和 Pull Request，并把 MCP 服务器、技能与插件的配置过程搬进当前会话。开发者不再需要为了接入一个工具反复查找、修改和验证配置文件。传统 CLI 助手通常沿着一条滚动历史向下运行。当任务从“分析错误...

# AI # InfoQ # 全栈

阅读全文

Datadog 如何用 Claude、Cursor 与测试驱动方法迁移关键生产系统

2026-07-10 来源: infoq.com 23

关键生产系统遇到存储后端的硬性限制时，迁移往往不是简单地替换客户端或复制数据。接口语义、历史边界条件、并发行为和性能特征都可能在切换过程中发生变化。Datadog 工程师 Arnold Wakim 分享的案例值得关注，原因不只是团队使用了 Claude 和 Cursor，而是他们把 AI 放进了一个由测试、性能数据和渐进式发布约束的生产迁移流程。从来...

# AI # InfoQ # LLM

阅读全文

Datadog 如何用 Claude、Cursor 与测试驱动方式迁移关键生产系统

2026-07-10 来源: infoq.com 31

当存储后端触及硬性上限时，团队面对的往往不是一次普通重构，而是一场必须保持线上行为稳定的系统迁移。Datadog 工程师 Arnold Wakim 分享的案例值得关注：团队借助 Claude 和 Cursor 推进关键生产系统演进，用测试约束 AI 生成的改动，在突破存储限制的同时显著改善性能。来源摘要没有披露具体存储引擎、数据模型和性能数字，因此下...

# AI # InfoQ # LLM

阅读全文

Waterfox G6.6.16.1 紧急修复：Qwant 默认搜索与区域参数恢复正常

2026-07-10 来源: oschina.net 33

Waterfox G6.6.16.1 是一次聚焦搜索功能的紧急修复。它处理了 Qwant 在不支持地区被设为默认搜索引擎、区域参数格式导致搜索请求被拒绝，以及 Qwant AI answers/summaries 默认状态不符合预期等问题。改动范围不大，但会直接影响地址栏搜索是否可用，因此使用 Qwant 或管理统一浏览器配置的团队值得尽快验证。此次...

# AI # 全栈 # 可观测性

阅读全文

从客服到网络运营：德国电信如何迈向 AI 原生运营商

2026-07-10 来源: openai.com 29

德国电信正在与 OpenAI 合作，把 AI 从零散的聊天机器人扩展到客户服务、员工工作流、网络运营和语音交互。这种变化的关键不在于部署多少个模型，而在于能否把模型接入真实业务系统，并用权限、审计、评估和人工接管机制约束它。电信运营商拥有大量跨系统流程：客服需要查询套餐、账单和故障记录；网络团队需要分析告警、变更和容量数据；员工则要在知识库、工单系统...

# AI # LLM # OpenAI

阅读全文

WordPress 7.0 把 AI 基础设施带进核心：升级前要看懂的三项变化

2026-07-10 来源: infoq.com 31

WordPress 7.0 于 2026 年 5 月 20 日发布。与一次常规的编辑器更新相比，这个版本的变化更接近平台能力扩展：核心开始提供 AI Client、Abilities API 和 Command Palette，同时重做管理后台并补充设计工具。另一项不能忽略的变化是 PHP 运行要求提高，这会直接影响旧主机、插件和自定义主题的升级路径。...

# AI # InfoQ # 全栈

阅读全文