用 AI Agent 动态调度放射科工作流，终结"挑拣病例"顽疾

预计阅读时间：14 分钟

62 家医院、220 万次影像检查的数据揭示了一个长期被忽视的问题：放射科医生在传统工作列表里疯狂"薅羊毛"——抢着读简单、高回报的病例，把复杂研究丢在队列里烂掉。这不是医生懒，是系统蠢。基于硬编码规则的工作列表完全无视医生专长、当前负荷、疲劳程度和病例复杂度，等于把一个需要动态决策的调度问题交给了静态路由表。AI Agent 的介入，正在把这张僵化的表变成一个能感知上下文、实时协商的智能调度引擎。

传统工作列表为什么必然失败

大多数医院放射科的工作列表逻辑是这样的：病例按时间排序，或者按几个固定优先级标签（stat、urgent、routine）排列。规则写死在 RIS/PACS 配置里，运行后无人再动。

问题在于——这些规则不知道：

谁在读：神经放射专科医生和胸部放射专科医生面对同一份头颅 MRI，效率差距可以大到 30 分钟 vs 2 小时。
谁累：一个连续读了 8 小时 CT 的医生，错误率已经悄然上升，但系统照样往他队列里堆。
什么复杂：一个多部位创伤 CT 的阅读时间可能是单部位扫描的 5 倍，优先级标签却可能同为 "urgent"。

结果就是：医生用人类本能绕过系统——挑简单、高 RVU（相对价值单位）的病例先读，复杂病例在队列里越积越多，诊断延迟从小时拖到天，急诊室等报告等到冒烟。

220 万次检查的数据量化了这个现象：复杂研究的平均等待时间显著高于简单研究，而高 RVU 研究被读取的速度远快于同等优先级的低 RVU 研究。系统在鼓励"薅羊毛"。

AI Agent 调度的核心逻辑

AI Agent 方案的思路不是给规则加更多 if-else，而是把调度交给一个能持续感知多维度上下文并动态决策的 Agent 系统。关键维度：

维度	传统规则	Agent 感知
医生专长	无	医师历史完成记录 + 子专科标签
当前负荷	无	实时队列深度 + 已读时长
疲劳估计	无	连续工作时长 + 近期错误率信号
症例复杂度	固定标签	模型预测阅读时长 + 临床上下文

Agent 的决策流程可以概括为：感知 → 评估 → 匹配 → 分发 → 反馈。每一步都有数据支撑，而不是靠直觉或静态权重。

一个最小可运行的调度 Agent 示例

下面用一个 Python 示例展示核心调度逻辑。这不是生产系统，但你可以直接跑起来、改参数、观察不同策略下的分配结果。

"""
radiology_agent_scheduler.py
最小放射科智能调度 Agent —— 可直接运行

依赖：pip install numpy
运行：python radiology_agent_scheduler.py
"""

import numpy as np
from dataclasses import dataclass, field
from typing import List
from datetime import datetime, timedelta

# ── 数据模型 ──────────────────────────────────────────

@dataclass
class Radiologist:
    name: str
    specialties: List[str]          # e.g. ["neuro", "chest"]
    shift_start: datetime
    cases_read_today: int = 0
    total_read_minutes_today: float = 0.0

    @property
    def fatigue_score(self) -> float:
        """0~1，越高越疲劳；超过 6 小时线性增长，上限 1.0"""
        hours = self.total_read_minutes_today / 60.0
        return min(1.0, max(0.0, (hours - 6.0) / 4.0)) if hours > 6 else 0.0

    @property
    def current_load(self) -> int:
        return self.cases_read_today


@dataclass
class Study:
    study_id: str
    modality: str                   # e.g. "CT", "MRI"
    body_part: str                  # e.g. "head", "chest", "spine"
    complexity: float               # 0~1，模型预测或人工标注
    priority_label: str             # "stat", "urgent", "routine"
    rvu: float                      # 相对价值单位
    wait_minutes: float = 0.0       # 已等待时长


# ── Agent 决策核心 ────────────────────────────────────

def specialty_match(radiologist: Radiologist, study: Study) -> float:
    """专长匹配度：body_part 在 specialties 里得 1.0，否则 0.3"""
    return 1.0 if study.body_part in radiologist.specialties else 0.3


def urgency_weight(study: Study) -> float:
    """紧急度加权：stat=3.0, urgent=2.0, routine=1.0，再加等待惩罚"""
    base = {"stat": 3.0, "urgent": 2.0, "routine": 1.0}.get(study.priority_label, 1.0)
    # 等待超过 60 分钟，每 30 分钟加 0.5 紧急度
    wait_penalty = max(0.0, (study.wait_minutes - 60.0) / 30.0) * 0.5
    return base + wait_penalty


def assignment_score(radiologist: Radiologist, study: Study) -> float:
    """
    综合评分 = 专长匹配 × 紧急度 × (1 - 疲劳惩罚) × 复杂度调节
    高分 = 更应该分配给该医生
    """
    spec = specialty_match(radiologist, study)
    urg = urgency_weight(study)
    fatigue_factor = 1.0 - 0.4 * radiologist.fatigue_score   # 疲劳最多扣 40%
    # 复杂病例更应分配给专长匹配的医生
    complexity_boost = 1.0 + 0.3 * study.complexity * spec
    return spec * urg * fatigue_factor * complexity_boost


def agent_assign(
    studies: List[Study],
    radiologists: List[Radiologist],
    top_n: int = 5,
) -> dict:
    """
    Agent 调度：对每个 study，计算所有医生的 assignment_score，
    返回 top_n 候选及分数，供最终分发决策使用。
    """
    assignments = {}
    for study in studies:
        scores = []
        for rad in radiologists:
            s = assignment_score(rad, study)
            scores.append((rad.name, s, {
                "specialty_match": specialty_match(rad, study),
                "urgency_weight": urgency_weight(study),
                "fatigue_factor": 1.0 - 0.4 * rad.fatigue_score,
                "rad_load": rad.current_load,
            }))
        # 按分数降序排列
        scores.sort(key=lambda x: x[1], reverse=True)
        assignments[study.study_id] = scores[:top_n]
    return assignments


# ── 模拟场景 ──────────────────────────────────────────

def run_simulation():
    now = datetime.now()

    radiologists = [
        Radiologist("张医生", specialties=["neuro", "head"],
                    shift_start=now - timedelta(hours=7),
                    cases_read_today=18, total_read_minutes_today=420),
        Radiologist("李医生", specialties=["chest", "abdomen"],
                    shift_start=now - timedelta(hours=3),
                    cases_read_today=6, total_read_minutes_today=150),
        Radiologist("王医生", specialties=["spine", "msk"],
                    shift_start=now - timedelta(hours=5),
                    cases_read_today=12, total_read_minutes_today=280),
    ]

    studies = [
        Study("S001", "MRI", "head", complexity=0.85, priority_label="stat", rvu=12.0, wait_minutes=45),
        Study("S002", "CT",  "chest", complexity=0.4, priority_label="urgent", rvu=8.0, wait_minutes=90),
        Study("S003", "CT",  "abdomen", complexity=0.6, priority_label="routine", rvu=6.5, wait_minutes=120),
        Study("S004", "MRI", "spine", complexity=0.7, priority_label="urgent", rvu=9.0, wait_minutes=30),
        Study("S005", "CT",  "head", complexity=0.9, priority_label="stat", rvu=14.0, wait_minutes=75),
    ]

    result = agent_assign(studies, radiologists)

    print("=" * 60)
    print("放射科 AI Agent 调度结果")
    print("=" * 60)

    for sid, candidates in result.items():
        study = next(s for s in studies if s.study_id == sid)
        print(f"\n病例 {sid} | {study.modality}-{study.body_part} "
              f"| 复杂度={study.complexity} | 优先级={study.priority_label} "
              f"| 等待={study.wait_minutes}min")
        print("-" * 50)
        for name, score, detail in candidates:
            print(f"  → {name}: 综合分={score:.2f} "
                  f"(专长={detail['specialty_match']:.1f} "
                  f"紧急={detail['urgency_weight']:.1f} "
                  f"疲劳因子={detail['fatigue_factor']:.2f} "
                  f"已读={detail['rad_load']}例)")

    # 对比：传统规则分配（按优先级标签 + 时间顺序，无视专长和疲劳）
    print("\n" + "=" * 60)
    print("对比：传统规则分配（按优先级 + 到达顺序，轮询分发）")
    print("=" * 60)
    priority_order = {"stat": 0, "urgent": 1, "routine": 2}
    sorted_studies = sorted(studies, key=lambda s: (priority_order[s.priority_label], s.wait_minutes))
    for i, study in enumerate(sorted_studies):
        rad = radiologists[i % len(radiologists)]
        print(f"  {study.study_id} → {rad.name} (轮询，无专长/疲劳考量)")

if __name__ == "__main__":
    run_simulation()

运行后你会看到：复杂头颅 MRI 被优先分配给神经专科的张医生——但他的疲劳因子已经打折；等待超时的胸部 CT 紧急度被自动提升；而传统规则只是轮询，把头颅病例丢给脊柱专科的王医生。

改造提示：你可以把 complexity 替换成真实模型预测值（比如用历史阅读时长回归），把 fatigue_score 接入医院排班系统的实时工时数据，把 assignment_score 的权重系数做成可配置项——这就是从 demo 走向生产的路径。

从 Demo 到生产：部署路径与风险清单

把 Agent 调度嵌入真实放射科工作流，需要考虑的远不止评分公式。

数据接入层

Agent 的感知能力取决于数据质量。最低要求：

医师专长数据：从 HR 系统或认证库导入子专科标签，至少每年更新一次。
实时负荷数据：从 RIS/PACS 拉取当前未完成病例数和当日已完成数，延迟不超过 5 分钟。
疲劳估计：没有直接传感器，用排班系统工时 + 近期错误率（如有 QA 数据）做代理指标。
病例复杂度：最简方案是用 modality + body_part + 检查类型的历史平均阅读时长做 lookup 表；进阶方案是训练一个回归模型。

决策执行层

Agent 计算出候选分配后，怎么落地？两种主流路径：

软性推荐：Agent 在工作列表顶部插入推荐排序，医生仍可手动选择。落地阻力小，但"薅羊毛"行为不会立刻消失。
硬性分配：Agent 直接把病例推给指定医生的个人队列，医生无法跳过。效果最强，但需要科室文化配合和工会/管理层背书。

建议从软性推荐起步，用 A/B 测试量化效果后再考虑收紧控制。

风险与边界

风险	说明	对策
模型偏差	复杂度预测模型可能对某些检查类型系统性低估	按模ality/body_part 分组监控预测误差
疲劳估计粗糙	工时只是代理变量，真实疲劳受睡眠、情绪等影响	结合 QA 错误率做校准，避免单独依赖工时
医生抵触	"被系统指派"感觉失去自主权	推荐模式起步，保留手动选择，透明展示评分依据
单点故障	Agent 服务宕机 = 工作列表回退到静态规则	必须有 fallback 到传统规则的开关，延迟 < 30s
公平性	Agent 可能系统性把低 RVU 病例推给某几位医生	监控 RVU 分布均匀性，加入公平性约束项

上线检查清单

[ ] 医师专长标签已导入并经过科室确认
[ ] RIS/PACS 实时负荷数据接口可用、延迟达标
[ ] 病例复杂度 lookup 表或模型已用历史数据验证（MAE < 20% 阅读时长）
[ ] Agent 服务有 fallback 开关，回退延迟 < 30 秒
[ ] A/B 测试方案已设计：对照组用传统规则，实验组用 Agent 推荐
[ ] RVU 分布均匀性监控仪表盘已上线
[ ] 科室会议已沟通方案，医生知晓评分逻辑和手动选择权

220 万次检查的数据已经证明：静态规则的工作列表在鼓励医生挑拣，惩罚的是最需要及时诊断的复杂病例和急诊患者。AI Agent 不是要取代医生的判断，而是给调度系统补上它本该有的上下文感知能力——谁擅长什么、谁已经累到该休息、哪个病例等不起。从上面的最小示例起步，接入真实数据，用 A/B 测试验证效果，这条路比给 RIS 加更多 if-else 规则要靠谱得多。