标签

LLM

从参数试错到智能协同：大模型、Agent 与 MCP 如何重塑 CAE 工作流

2026-07-15 来源: oschina.net 30

随着大语言模型推理能力增强、Agent 框架进入工程化阶段，以及 MCP 等工具互通协议逐渐成熟，AI 对 CAE 的影响已经不只是在软件里增加一个问答窗口。更值得关注的变化，是把需求理解、参数生成、求解器调用、结果检查和报告整理连接成一条可追踪、可干预的自动化链路。围绕 2026 年 7 月 23 日举行的“AI 赋能 CAE 软件开发与应用技术研...

# AI # LLM # 全栈

阅读全文

Dragonfly v2.5.0：用 dfget 直接拉取 Hugging Face 与 ModelScope 模型仓库

2026-07-15 来源: oschina.net 25

Dragonfly v2.5.0 为模型分发补上了一个实用入口：Dragonfly Client 现在可以通过直接下载 Hugging Face 和 ModelScope 上的模型仓库。对于需要在开发机、GPU 节点或批处理任务中准备模型文件的团队，这意味着模型仓库可以进入现有的 Dragonfly 下载流程，而不必为每个平台单独设计一套入口。新版...

# AI # Go # LLM

阅读全文

Qwen-Audio-3.0-Realtime 发布：如何把低延迟语音、推理与工具调用接入真实业务

2026-07-15 来源: oschina.net 30

实时语音模型最难处理的矛盾，不是“能不能听懂”，而是如何在用户仍然期待即时反馈时完成推理、调用工具并自然开口。Qwen-Audio-3.0-Realtime 的发布正面回应了这个问题：公告将升级集中在推理能力、Agent 工具调用、共情对话和双工交互流畅度四条主线上，并提供偏重推理的 Plus 版本与偏重速度的 Flash 版本。这意味着开发者面对的...

# AI # LLM # 全栈

阅读全文

Real World VoiceEQ：如何衡量语音 AI 的“真人感”

2026-07-15 来源: huggingface.co 23

语音 AI 的评估正在从“能不能听清”转向“是否像一个合格的人类交流者”。仅看字错率、响应延迟或音频自然度，很难解释系统为什么在实验室里表现良好，进入电话客服、语音助手或实时陪练场景后却让用户频繁打断、重复问题，甚至直接退出对话。Real World VoiceEQ 关注的正是这个缺口：在真实交互条件下衡量语音 AI 的人类交流质量。由于给定材料只有...

# AI # Hugging Face # LLM

阅读全文

Thinking Machines 欢迎 Inkling：面对新 AI 项目，先验证能力边界再谈接入

2026-07-15 来源: huggingface.co 21

Thinking Machines 以“Welcome Inkling”为题介绍 Inkling，但现有来源摘要没有披露它究竟是模型、产品、研究项目还是新加入的团队，也没有给出 API、性能或发布时间等细节。因此，对开发者最有价值的做法不是猜测具体功能，而是建立一套可复用的评估流程：等正式接口和文档公布后，用同一批任务快速验证能力、成本、延迟与安全边界...

# AI # Hugging Face # LLM

阅读全文

从线索发现到个性化邮件：用 Strands Agents 与 Amazon Bedrock 构建多智能体销售流水线

2026-07-15 来源: aws.amazon.com 38

多智能体系统真正进入生产环境后，难点不再只是“让几个 Agent 相互调用”，而是如何控制执行路径、稳定评估线索、限制成本，并确保生成的销售邮件有依据、可审计。Thrad.ai 的实践覆盖了从潜在客户发现到个性化邮件生成的完整流程，并对 Strands Agents 中的 Swarm 与 Graph 两种编排方式进行了延迟、成本和邮件质量的正面对比。 ...

# AI # AWS # Go

阅读全文

从队列深度到自动扩缩容：为 Kubernetes 编写自定义指标 Exporter

2026-07-15 来源: kubernetes.io 42

Kubernetes 原生理解 CPU 和内存，但真实业务压力往往来自另一组信号：消息队列里积压了多少任务、最近一次批处理耗时多久、每个 Pod 维持了多少 WebSocket 连接。自定义指标 Exporter 的作用，就是把这些应用状态转换成 Prometheus 能抓取的时间序列，为查询、告警以及后续的 HPA 自动扩缩容提供数据基础。 Expo...

# AI # Docker # Go

阅读全文

从基础模型到可治理智能体：Google 企业 AI 一体化栈的关键价值

2026-07-15 来源: cloud.google.com 29

Google 在 IDC MarketScape 2026 全球基础模型软件厂商评估中被列为领导者。比排名本身更值得开发团队关注的，是其背后的产品路线：将 Google DeepMind 的前沿模型、专用 AI 基础设施、智能体平台、企业入口和治理能力组合为一套生产系统。竞争焦点已经不只是“哪个模型回答得更好”，而是谁能让模型可靠、安全地执行真实业务流...

# AI # GCP # Go

阅读全文

把 LLM 评测从数周压缩到一天：一条可持续迭代的工程路径

2026-07-15 来源: medium.com 30

LLM 应用真正拖慢迭代的，往往不是模型调用本身，而是准备数据、批量执行、人工复核和汇总结果之间的等待。来源标题给出了一个鲜明结果：评测周期从数周缩短到一天。由于摘要没有披露具体实现，下面不推测原团队的技术栈，而是给出一套可以这样实践的工程方案：让评测集可版本化，让任务并发执行，让失败能够恢复，并把人工判断集中在最有价值的样本上。一次完整评测通常由多...

# AI # Airbnb # LLM

阅读全文

用测试套件与 CLI 将 Amazon Nova Act 智能 QA 接入回归测试流水线

2026-07-15 来源: aws.amazon.com 28

单个智能测试能够验证一条用户路径，但软件交付真正棘手的部分，是在每次合并、发布和环境变更后稳定地重跑整批回归用例。QA Studio 在 Amazon Nova Act 智能测试能力之上，引入测试套件与命令行接口：前者负责组织和并行执行测试，后者把这些测试带入 CI/CD 流水线。回归测试不能只是把几十条命令顺序执行一遍。团队通常需要同时处理三类问题...

# AI # AWS # LLM

阅读全文