Kafka + Flink 管道里的 Schema 瘟疫：用判别字段把几十张表压成两张

预计阅读时间：10 分钟

一条事件流一个 Schema，刚开始觉得干净利落——订单创建一个、订单取消一个、订单退款一个。等事件类型涨到十几个，Flink SQL 里全是 UNION ALL，改一个字段名要同时更新十几个 Avro 定义、重部署十几个消费者。Schema 增殖像慢性病：起病慢，发作猛。判别字段（discriminator）方案能把这堆表压到两张，新事件类型只加行不加表，老消费者不中断。

增殖是怎么一步步失控的

典型起步：业务新增一种事件，最直觉的做法是注册一个新 Schema、建一张新表。三个月后：

Schema Registry 里堆了 15 个主题各自的 Schema 版本链。
Flink 作业里 15 路 UNION ALL，每路都要对齐字段顺序和类型。
某天 userId 要改成 user_id——改一个字段，15 个 Schema 全要演进，15 个消费者全要适配新版本。

问题不只是"多"。多表之间的字段漂移才是真正的运维杀手：表 A 的 amount 是 DECIMAL(10,2)，表 B 写成了 DOUBLE，UNION ALL 一跑就隐式转型，精度悄悄丢了。

判别字段方案：两张表收容所有变体

核心思路：不再按事件类型分表，而是按"是否共享核心字段"分两层。

核心表（core table）——所有事件类型共享的字段放这里：event_type 作为判别字段，加上 event_id、timestamp、user_id 等通用列。
扩展表（extension table）——每种事件类型的独有字段以 JSON 或动态列存储，通过 event_type 判别字段做行级过滤。

新事件类型？加一行 event_type = 'ORDER_EXPRESS_DELIVERY'，核心表结构不动，扩展表多几条 JSON payload。老消费者只读核心表，完全无感。

Flink SQL 实战：从 15 路 UNION 到单表查询

下面用一个可跑的 Flink SQL 示例演示完整改造路径。假设你用 Flink 1.17+，Kafka connector + Avro format 已就绪。

增殖形态（改造前）

-- 每种事件一张表，UNION ALL 拼接
CREATE TABLE order_created (
  event_id   STRING,
  user_id    STRING,
  amount     DECIMAL(10, 2),
  proctime   AS PROCTIME()
) WITH (
  'connector' = 'kafka',
  'topic'     = 'order-created',
  'format'    = 'avro',
  'properties.bootstrap.servers' = 'kafka:9092',
  'properties.group.id' = 'flink-order-created'
);

CREATE TABLE order_cancelled (
  event_id   STRING,
  user_id    STRING,
  reason     STRING,
  proctime   AS PROCTIME()
) WITH (
  'connector' = 'kafka',
  'topic'     = 'order-cancelled',
  'format'    = 'avro',
  'properties.bootstrap.servers' = 'kafka:9092',
  'properties.group.id' = 'flink-order-cancelled'
);

-- 再来 order_refunded, order_shipped ... 一路加下去

-- 查询：所有订单相关事件
SELECT 'CREATED' AS event_type, event_id, user_id, CAST(amount AS STRING) AS detail
FROM order_created
UNION ALL
SELECT 'CANCELLED' AS event_type, event_id, user_id, reason AS detail
FROM order_cancelled
-- UNION ALL ... 继续 13 路
;

每加一种事件，就要改这段 SQL、重新部署作业。

判别字段形态（改造后）

-- 核心表：单一 Kafka 主题，所有事件共用
CREATE TABLE order_events_core (
  event_type  STRING,        -- 判别字段：CREATED / CANCELLED / REFUNDED ...
  event_id    STRING,
  user_id     STRING,
  ts          TIMESTAMP(3),
  payload     STRING,        -- 扩展字段 JSON payload
  proctime    AS PROCTIME(),
  WATERMARK FOR ts AS ts - INTERVAL '5' SECOND
) WITH (
  'connector' = 'kafka',
  'topic'     = 'order-events-all',  -- 合并后的单一主题
  'format'    = 'avro',
  'avro.schema.literal' = '
    {
      "type": "record",
      "name": "OrderEvent",
      "fields": [
        {"name": "event_type", "type": "string"},
        {"name": "event_id",   "type": "string"},
        {"name": "user_id",    "type": "string"},
        {"name": "ts",         "type": {"type": "long", "logicalType": "timestamp-millis"}},
        {"name": "payload",    "type": "string"}
      ]
    }
  ',
  'properties.bootstrap.servers' = 'kafka:9092',
  'properties.group.id' = 'flink-order-events'
);

-- 查询：单表 + WHERE，不再需要 UNION ALL
SELECT event_id, user_id, event_type, payload
FROM order_events_core
WHERE event_type IN ('CREATED', 'CANCELLED', 'REFUNDED')
;

-- 只关心创建事件的消费者——过滤条件一加就行，新事件类型对它完全透明
SELECT event_id, user_id,
       CAST(JSON_VALUE(payload, '$.amount') AS DECIMAL(10, 2)) AS amount
FROM order_events_core
WHERE event_type = 'CREATED'
;

关键变化：

维度	增殖形态	判别字段形态
Kafka 主题数	N（每事件一个）	1（合并主题）
Schema 数	N	1（核心表 + payload 内嵌）
查询方式	N 路 UNION ALL	单表 WHERE
新增事件类型	加表 + 加 UNION + 改 SQL	加 payload 行，SQL 不动
字段重命名影响	N 个 Schema 演进	1 个 Schema 演进

合流脚本：把多主题数据灌入合并主题

改造不是一蹴而就——老主题还在生产，需要一个过渡期的合流作业：

# merge_topics.py — 用 confluent-kafka 把多主题数据写入合并主题
# 依赖：pip install confluent-kafka

from confluent_kafka import Consumer, Producer
import json

BOOTSTRAP = "kafka:9092"
SOURCE_TOPICS = ["order-created", "order-cancelled", "order-refunded"]
TARGET_TOPIC  = "order-events-all"

# 事件类型与主题的映射
TOPIC_TO_EVENT_TYPE = {
    "order-created":   "CREATED",
    "order-cancelled": "CANCELLED",
    "order-refunded":  "REFUNDED",
}

consumer = Consumer({
    "bootstrap.servers": BOOTSTRAP,
    "group.id": "schema-merge-migrator",
    "auto.offset.reset": "earliest",
})
consumer.subscribe(SOURCE_TOPICS)

producer = Producer({"bootstrap.servers": BOOTSTRAP})

def delivery_report(err, msg):
    if err:
        print(f"Delivery failed: {err}")

while True:
    msg = consumer.poll(1.0)
    if msg is None:
        continue
    if msg.error():
        print(f"Consumer error: {msg.error()}")
        continue

    event_type = TOPIC_TO_EVENT_TYPE.get(msg.topic(), "UNKNOWN")
    original_value = json.loads(msg.value().decode("utf-8"))

    # 构造合并后的统一结构：核心字段 + payload
    merged = {
        "event_type": event_type,
        "event_id":   original_value.get("event_id", ""),
        "user_id":    original_value.get("user_id", ""),
        "ts":         original_value.get("ts", 0),
        "payload":    json.dumps(original_value),  # 原始数据整体塞进 payload
    }

    producer.produce(
        TARGET_TOPIC,
        key=merged["event_id"],
        value=json.dumps(merged).encode("utf-8"),
        callback=delivery_report,
    )
    producer.poll(0)

producer.flush()

运行前改 BOOTSTRAP 和 SOURCE_TOPICS。迁移完成后，上游生产者逐步切换到直接写 order-events-all，老主题退役。

判别字段的边界与取舍

方案不是银弹，几个需要权衡的点：

payload 是 JSON 字符串——Flink 里用 JSON_VALUE / CAST 提取字段，性能不如原生列。高频查询的扩展字段（比如 amount）可以考虑从 payload 提升到核心表做显式列，这仍然是单 Schema 改动。
Schema Registry 兼容性——核心表 Avro Schema 演进时，新增字段必须给默认值（Avro 兼容规则），否则老消费者反序列化失败。
下游分析引擎——如果用 Trino / Spark 读 Kafka，payload JSON 需要额外解析步骤；有些团队选择在 Flink 侧先做一次扁平化写入 Hive/Iceberg，再供查询。
判别字段枚举管理——event_type 的合法值需要文档化，否则新值悄悄进来，WHERE 过滤漏掉。建议在 Schema Registry 侧加一条注释字段，或在核心表 DDL 里加注释说明。

适用场景：事件类型多、核心字段重叠度高、新增类型频繁。如果每种事件的字段结构差异极大（几乎无共享列），判别字段的收益有限，反而 payload 会膨胀——这时候按领域拆两三个合并主题比强行压成一张表更合理。

上手检查清单

列出当前所有事件类型，标注共享字段——如果核心字段覆盖率 > 60%，判别字段方案值得做。
定义核心表 Avro Schema，payload 用 string 类型兜底，先跑合流脚本灌数据，验证 Flink SQL 查询结果与老 UNION 一致。
逐步切换上游生产者：先双写（老主题 + 合并主题同时写），确认下游无异常，再停老主题。
高频查询的 payload 字段，逐步提升到核心表显式列——一次只提一个字段，保持演进可控。
在 CI 里加一条检查：核心表 Schema 变更必须通过 Avro 兼容性校验（BACKWARD 或 FULL）。

Schema 增殖不是设计失误，而是"每条流一个 Schema"这个直觉决策的自然后果。判别字段方案用一次结构重组换长期的可维护性——两张表、一个查询、新类型只加行。改动有成本，但越早做，回滚越容易。