AI 的十二道阴影：一个工程师的清醒账本

预计阅读时间：11 分钟

一位刚入职软件公司的开发者写了篇长文，把当前 AI 产业的十二个核心问题摊开摆在桌上——从能源消耗到版权争议，从军事应用到教育影响。这不是又一篇"AI将改变世界"的颂歌，而是一份冷静的账单。对每天在调用 API、部署模型的工程师来说，这些数字和争议不是远方的故事，而是你下一次 curl 请求背后的真实代价。

算力账单：能源与水的双重消耗

最刺眼的一组对比：向 ChatGPT 提问一次的能耗，大约是传统搜索引擎查询的 10 倍。这还没算上"AI 概览"类搜索——传统检索叠加 AI 摘要，能耗再翻一层。

水资源的消耗同样被低估。数据中心冷却需要大量淡水，而很多数据中心建在已经面临水资源压力的地区。训练一个大模型期间消耗的水量，足以填满一个中型游泳池。这些资源成本不会出现在你的 API 调用账单上，但它们确实存在。

版权黑洞：训练数据的归属困境

模型训练依赖海量文本、图像、代码。这些数据的原作者几乎从未被逐一告知或获得补偿。当前的法律框架还没有给出清晰答案：模型输出算"衍生作品"还是"新创作"？训练数据的使用算"合理使用"还是"侵权"？

对工程师而言，这个问题不只是法律抽象讨论。你用生成式 AI 辅助写代码，产出的代码片段是否包含从他人 GPL 项目中"学来"的模式？你部署的模型服务，是否会在未来某天收到版权诉讼？这些风险现在没有定论，但值得提前纳入技术决策。

更暗的角落：军事应用与教育异化

AI 产业的资金流向并不只有商业场景。军事领域的 AI 应用——从目标识别到自主决策系统——正在加速落地，而技术社区对此的讨论远少于对新产品功能的欢呼。

教育方面的问题更隐蔽。学生用 AI 写作业、生成论文，表面看是"效率提升"，实质是理解能力的外包。当学习者不再经历"想不清楚→反复挣扎→终于弄懂"这个过程，知识的根系就没有真正扎下去。

量化你的 AI 调用足迹

抽象的伦理讨论容易滑向空泛，但工程师可以做的第一件事是：量化和追踪自己系统中的 AI 调用成本——不只是金钱成本，还包括估算的能源消耗。

下面是一个可直接运行的 Python 脚本，用于记录和估算每次 AI API 调用的能源足迹：

#!/usr/bin/env python3
"""
ai_footprint_tracker.py
记录每次 AI API 调用的 token 数量，并估算对应的能源消耗。

使用方式：
  1. pip install tiktoken  # OpenAI 的 token 计数库
  2. 将此脚本集成到你的 AI 调用流程中
  3. 定期查看 footprint_log.json 的累计数据

能源估算参考：
  - 单次 ChatGPT 查询约 0.002–0.004 kWh（含推理阶段）
  - 传统搜索查询约 0.0003 kWh
  - 数据来源：University of Washington, EPRI 等公开研究
  - 这些是粗略估算，不同模型和硬件差异很大，请根据实际调整
"""

import json
import time
from pathlib import Path

# ── 配置 ──────────────────────────────────────────
LOG_FILE = Path("footprint_log.json")

# kWh / 1K tokens 的估算值（可按你使用的模型调整）
# GPT-4 级别模型推理约 0.003 kWh / 查询，折算到 token 级别
KWH_PER_1K_TOKENS = 0.0008  # 粗略估算，推理阶段
WATER_L_PER_1K_TOKENS = 0.01  # 淡水消耗估算（升）

# 传统搜索对比基准
KWH_PER_SEARCH = 0.0003


def count_tokens(text: str, model: str = "gpt-4") -> int:
    """用 tiktoken 计算 token 数。如果没安装，退回字符估算。"""
    try:
        import tiktoken
        enc = tiktoken.encoding_for_model(model)
        return len(enc.encode(text))
    except Exception:
        # 退回粗略估算：英文 ~4 字符/token，中文 ~2 字符/token
        return max(1, len(text) // 3)


def log_call(
    prompt: str,
    response: str,
    model: str = "gpt-4",
    notes: str = "",
):
    """记录一次 AI 调用的足迹。"""
    prompt_tokens = count_tokens(prompt, model)
    response_tokens = count_tokens(response, model)
    total_tokens = prompt_tokens + response_tokens

    estimated_kwh = (total_tokens / 1000) * KWH_PER_1K_TOKENS
    estimated_water = (total_tokens / 1000) * WATER_L_PER_1K_TOKENS
    search_equivalent = estimated_kwh / KWH_PER_SEARCH

    entry = {
        "timestamp": time.strftime("%Y-%m-%dT%H:%M:%S"),
        "model": model,
        "prompt_tokens": prompt_tokens,
        "response_tokens": response_tokens,
        "total_tokens": total_tokens,
        "estimated_kwh": round(estimated_kwh, 6),
        "estimated_water_liters": round(estimated_water, 4),
        "search_equivalent": round(search_equivalent, 1),
        "notes": notes,
    }

    # 追加写入日志
    records = []
    if LOG_FILE.exists():
        records = json.loads(LOG_FILE.read_text())
    records.append(entry)
    LOG_FILE.write_text(json.dumps(records, indent=2, ensure_ascii=False))

    # 打印本次摘要
    print(f"[足迹] tokens={total_tokens}  "
          f"能耗≈{estimated_kwh:.4f} kWh  "
          f"≈{search_equivalent:.1f}次传统搜索  "
          f"水耗≈{estimated_water:.2f} L")
    return entry


def summary():
    """打印累计足迹摘要。"""
    if not LOG_FILE.exists():
        print("暂无记录。")
        return
    records = json.loads(LOG_FILE.read_text())
    total_kwh = sum(r["estimated_kwh"] for r in records)
    total_water = sum(r["estimated_water_liters"] for r in records)
    total_calls = len(records)
    total_tokens = sum(r["total_tokens"] for r in records)

    print(f"\n{'='*50}")
    print(f"AI 调用足迹摘要")
    print(f"{'='*50}")
    print(f"总调用次数:   {total_calls}")
    print(f"总 token 数:  {total_tokens}")
    print(f"总能耗估算:   {total_kwh:.4f} kWh "
          f"(≈{total_kwh/KWH_PER_SEARCH:.0f} 次传统搜索)")
    print(f"总水耗估算:   {total_water:.2f} 升")
    print(f"{'='*50}\n")


# ── 示例用法 ──────────────────────────────────────
if __name__ == "__main__":
    # 模拟一次 AI 调用（实际使用时替换为真实 prompt/response）
    log_call(
        prompt="请解释 Transformer 模型的自注意力机制",
        response="自注意力机制允许序列中每个位置直接关注所有其他位置……",
        model="gpt-4",
        notes="测试记录",
    )
    log_call(
        prompt="用 Python 写一个快速排序",
        response="def quicksort(arr): ...",
        model="gpt-4",
        notes="代码生成",
    )
    summary()

运行方式：

pip install tiktoken
python ai_footprint_tracker.py

输出示例：

[足迹] tokens=47  能耗≈0.0376 kWh  ≈125.3次传统搜索  水耗≈0.47 L
[足迹] tokens=23  能耗≈0.0184 kWh  ≈61.3次传统搜索  水耗≈0.23 L

==================================================
AI 调用足迹摘要
==================================================
总调用次数:   2
总 token 数:  70
总能耗估算:   0.0560 kWh (≈187 次传统搜索)
总水耗估算:   0.70 升
==================================================

这个脚本的估算值是粗略的，不同模型、不同硬件集群差异很大。它的价值不在精确，在于让隐形的消耗变成可见的数字。你可以把它嵌入到任何调用 AI API 的流程中——每次请求前后各记一行，月底跑一次 summary()，就能看到你的系统在资源层面留下了什么。

工程师的行动清单

十二个问题不可能一夜解决，但每个团队可以从具体动作开始：

记录足迹——用上面的脚本或类似工具，量化你的 AI 调用能耗和水耗，纳入团队的技术评审。
减少冗余调用——缓存常见查询的结果，避免同一 prompt 反复请求；优先用小模型处理简单任务，只在必要时调用大模型。
审查训练数据来源——如果你在微调模型，确认数据集的许可证和来源；避免使用版权状态不明的爬取数据。
设置使用边界——在产品层面限制 AI 辅助的范围，比如代码生成只提供片段而非完整文件，教育类产品要求用户标注 AI 参与比例。
关注供应链——选择云服务商时，了解其数据中心的能源结构和水资源情况；优先选择有公开可持续报告的供应商。
参与讨论——在技术社区中不只谈性能和功能，也谈代价和边界。沉默本身就是对"野蛮生长"的默许。

这些问题的核心不是"要不要用 AI"，而是用的时候是否清楚代价、是否愿意承担对应的责任。账本已经摊开，数字已经写在上面——剩下的选择，在每个工程师手里。